使用python scrapy框架抓取cnblog 的文章内容

https://www.cnblogs.com/threemore/p/5578372.html

 

scrapy 的文档请移驾到 http://scrapy-chs.readthedocs.io/zh_CN/0.24/intro/install.html

1、准备工作 [……]

继续阅读

python写中文内容文件

https://stackoverflow.com/questions/18337407/saving-utf-8-texts-in-json-dumps-as-utf8-not-as-u-escape-sequence

 

easy like a cake

To wri[……]

继续阅读

scrapy抓取后导出中文内容文件办法

https://stackoverflow.com/questions/9181214/scrapy-text-encoding#comment11599115_9195158

 

scrapy抓取后导出文件是unicode编码:

scrapy crawl cmgine -o[......]

继续阅读

supervisord部署总结

#安装pip
wget https://bootstrap.pypa.io/get-pip.py
python get-pip.py

#安装supervisord
pip install supervisor

#初始化配置文件
echo_supervisord_conf >[......]

继续阅读

利用Python,四步掌握机器学习

利用Python,四步掌握机器学习

 

为了理解和应用机器学习技术,你需要学习 Python 或者 R。这两者都是与 C、Java、PHP 相类似的编程语言。但是,因为 Python 与 R 都比较年轻,而且更加“远离”CPU,所以它们显得简单一些。相对于R 只用于处理数据,使[……]

继续阅读

正则表达式

https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143193331387014ccd1040c814dee8b2164bb4f064cff000

 

字符[……]

继续阅读

Python 爬虫:把廖雪峰教程转换成 PDF 电子书

https://foofish.net/python-crawler-html2pdf.html

 

写爬虫似乎没有比用 Python 更合适了,Python 社区提供的爬虫工具多得让你眼花缭乱,各种拿来就可以直接用的 library 分分钟就可以写出一个爬虫出来,今天尝试写一[……]

继续阅读

NodeJS + PhantomJS 抓取页面信息以及截图

http://www.cnblogs.com/justany/p/3279717.html

 

利用PhantomJS做网页截图经济适用,但其API较少,做其他功能就比较吃力了。例如,其自带的Web Server Mongoose最高只能同时支持10个请求,指望他能独立成为一个[……]

继续阅读

Django CRUD (Create, Retrieve, Update, Delete)

https://rayed.com/wordpress/?p=1266

 

UPDATE 1: The main example use Class Based Views, I also added Function Based Views version of the sa[……]

继续阅读

python学习之–Django–连接数据库mysql创建model

http://blog.csdn.net/viease/article/details/45093875

 

1.

建立一个project

2.

创建第一个页面

3.

创建一个app

4.

然后给app增加一个页[……]

继续阅读