好用的文章采集工具(好的量化工具,能让你操作起来更得心应手~ )
优采云 发布时间: 2022-03-24 07:08好用的文章采集工具(好的量化工具,能让你操作起来更得心应手~
)
一个好的量化工具可以让你操作更得心应手~
大家好,我是淼淼江,上海漂流量化的中文女报,爱说唱。
就像切西瓜一样,可以用刀切。如果非要硬着头皮用蛮力打开,不仅会浪费你的精力,还会让你感受不到吃西瓜带来的清爽感,甚至让你越来越烦躁。
而当我们学会量化的时候,用对的工具其实也是一样的~
一款合适的量化学习工具,会让你的各种细节操作更加得心应手,甚至会成为你的得力助手o(* ̄︶ ̄*)o~
就在今天早上,看到群里有朋友在分享量化的学习资源。那么今天,妙妙酱再跟大家分享一下。量化常用的六种工具可视为资源共享。希望对大家学习量化有所帮助。
01 量化软件推荐:Python
常用的量化软件有python、matlab、java、C++等。就开发难度而言,python和matlab比较容易,而java和C++比较麻烦。在运行速度方面,C++和java比matlab和python快。
然而,对于大多数人,尤其是初学者来说,开发所花费的时间远比运行时长。如果追求速度,可以先制定策略,然后用 C++ 重写。另外,在量化资源方面,python资源比matlab多,而matlab是商业软件,python是免费开源的。所以推荐大家使用python。
如果使用 python,最好下载 anaconda。本软件集成了常用库,免去自己安装的麻烦。
因此,如果你是一个零基础的编程学生,你无疑会选择 Python 作为入门级的量化编程语言。
▲Anaconda网站官网
官网地址:
02 推荐数据来源:tushare
关于数据获取,有Wind就好了,但是Wind很贵,大家可以在学习阶段使用免费的数据源,比如Tushare。
Tushare是一个比较老的数据接口,收录了很多沪深股票、指数、公募基金、期货、期权、债券、外汇等金融数据。使用接口的方法也很简单,而且导出的数据直接采用 pandas DataFrame 格式。所以非常方便。缺点是有些数据需要一定的积分才能获取,更头疼的是积分会定期清理。之前好不容易得了500多分,看到只剩下120分,我哭了。
但是,搭建这个平台还是需要付出很大的努力,所以需要点来检索数据是无可厚非的。那么如果不想积分的话,也可以使用老版本的tushare。虽然老版本的tushare已经不再维护,但是部分数据接口还是可以使用的,平时用来学习也可以。
总体来说,途共享支持的数据非常全面,使用方式也比较友好。
官网地址:
03搭建量化框架所必需的量化平台
依托上面提到的软件和数据源,我们可以在本地部署量化环境。但是,特别是对于初学者来说,自己搭建量化框架和量化平台的缺点之一就是比较麻烦,也比较费时间。
另外,更重要的是,自己部署的回测环境可能还有很多没有考虑到的问题,比如限价交易、停牌、撮合机制等。
因此,建议您使用量化平台。
量化平台可以看作是一个已经搭建好的框架。您只需要添加一些自己的交易条件来回测策略,无需从头开始构建基本框架。
目前常见的免费量化平台有ricequant、joinquant、优矿。
当然,以上是量化的一些基本工具,根据策略可能会用到其他一些工具。
04 数据库推荐:SQLite
如果策略需要存储大量数据,则需要数据库软件。Python自带SQLite3库,可以很方便的用python操作SQLite数据库。
SQLite 数据库是一款非常小巧的嵌入式开源数据库软件。虽然它的功能不如上面的大型数据库全面,但是使用起来非常简单方便,不需要复杂的安装,非常适合初学者。
Sqlite下载地址:
教程可以参考菜鸟教程的SQLite教程。
网站链接:
因为如果你想在机构实习,一般机构都会有自己的数据库,所以要懂一点SQL。但是,SQL 非常简单。如果你只是自学,你可以使用 SQLite 来练习你的技能,因为其他数据库使用的 SQL 语言是相同的。
05机器学习推荐:Scikit-learn
对机器学习有所了解的同学一定知道这个scikit-learn,就是sklearn模块。该模块封装了常用的机器学习方法,包括用于监督学习的回归算法、分类算法、用于无监督学习的降维和聚类等。
Scikit-learn封装了很多常用的算法,可以直接使用,免去自己写算法的麻烦。
06网络资讯采集推荐:BeautifulSoup等
有时,我们使用 SQL 语句从公司数据库中检索数据,而除了这些数据之外,有时我们还需要从网页中获取数据。比如基于大数据的舆情分析策略,需要我们从网页中抓取舆情数据,这就需要用到爬虫技术。
在这里,我们推荐BeautifulSoup4,这是一个非常常用的爬虫模块。可以直接参考它的中文文档,先学习request。
需要提醒的是,大家在爬取数据的时候,不要鲁莽行事,否则“爬虫玩得好,监狱早进”。
另外,我个人建议,如果想学习这方面的知识,可以参考《Python网络数据采集》一书。书中作者使用简洁而强大的Python语言介绍了网络数据采集,并对现代网络中的各种数据类型进行了全面的指导。
总的来说,这是一本值得一读的好书。
好了,量化工具暂时更新到这里。以上是我目前能想到的量化投资工具。
有什么要补充的请在公众号后台留言或者加我微信私聊~
看完别忘了点个赞~biubiu~