我用python日常的工作:
1 做网站,开发内部系统。
2 页面抓取数据分析。
3 中文词库,聚合分类等。比如完成一些SEO的需求
4 一般日常的工作。
觉的比较好的Python包
PIL用来处理图像非常方便,读取,改写,转换,保存,创建,底层数据访问等都支持都不错
lxml用来处理HTML很便利,兼容性好,效率高。但是输入的最好是unicode,除非是XML包装的HTML.
numpy与scipy也许我们实际用得不多,但是在数学运算的时候确实需要,而且很多包都依赖它们,例如下面的matplotlib
matplotlib用来画曲线图,统计图,曲面图等都非常好
chardet可以用来推测网页的编码,原下载页面已经不可访问了,因此备份了一个
Protobuf是一个在时间与空间上都非常高效的数据包编码解码包,可用于网络通讯,支持C/Python/Java等语言
twisted是一个很棒的网络客户端与服务器端的开发框架,开发TCP/UDP/HTTP/SMTP等客户端与服务器端都很方便
markdown可以用来将markdown文档,例如本文档,转化为HTML格式,当然,使用md2html会更方便。另一个选择是使用Pandoc软件,能转换极多的文档格式
beautifulsoup 分析HTML页面数据。
scrapy 一个python的采集框架。
nltk,jieba 自然语言处理等。
python 的不爽的地方:
1 编码的问题。
2 并发与性能。
3做客户端软件,安装包打包会比较大。
Copyright © 2008