IT博客汇
  • 首页
  • 精华
  • 技术
  • 设计
  • 资讯
  • 扯淡
  • 权利声明
  • 登录 注册

    数据分析:目录

    SparkAndShine发表于 2021-02-09 23:18:15
    love 0

    本文将数据分析相关的笔记整理成目录的形式,便于索引,包括数据获取、Python、数据分析。

    1. 数据获取

    1.1 爬虫

    • 第一个爬虫程序:建立联系方式表格
    • Python爬取成语:从3字到12字
    • 爬虫与反爬:使用用户代理User-agent
    • 爬虫与反爬:使用代理proxy
    • 抓取由jQuery动态产生的网页数据:以东方财富中的沪港通历史数据为例
    • 爬虫与反爬:使用Selenium+ChromeDriver抓取动态网页

    1.2 数据

    GTFS数据

    • GTFS Application Notes: Table of Contents

    金额数据:

    • 使用Tushare获取北上资金
    • 抓取由jQuery动态产生的网页数据:以东方财富中的沪港通历史数据为例

    2. Python

    基础

    • Python脚本学习笔记:基本语法、流程控制、自定义函数
    • Python使用笔记:格式化字符串
    • Python Application Notes: list
    • Python Application Notes: set and frozenset
    • Python Application Notes: dict
    • Python Application Notes: mutable, hashable and iterable
    • Python Application Notes: packages, modules and classes
    • Python使用笔记:面向对象基本语法

    文件处理

    • Python Application Notes: pathname manipulations
    • Read and write Excel files with Python
    • Read and write Excel files with Python
    • Python以unicode编码格式读入外部文件

    时间处理

    • Python Application Notes: The datetime module
    • Python使用笔记:时间的运算timedelta

    NetworkX

    • NetworkX使用笔记:基本操作
    • NetworkX Application Notes: Draw a graph with matplotlib
    • Draw with Matplotlib: Basic Steps for Plotting a Figure
    • Draw with Matplotlib: Colors, Markers and Line Styles
    • Draw with Matplotlib: (Stacked) Bar Charts with error bar
    • NetworkX使用笔记:读入外部文件并转换成各种格式
    • NetworkX Application Notes: Draw trees with pygraphviz
    • NetworkX Application Notes: A better way to visualize graphs
    • python-igraph安装及用外部文件创建图

    其他

    • Build a Windows executable from Python scripts on Linux
    • 用Python批量查询域名(并行化,附源代码)
    • 批量查询5个字成语首字母组成的.com域名
    • 用Python操作MySQL数据库
    • 在新浪云安装Python应用
    • 写Python脚本让带参数程序运行多次
    • Install Pyhton module Fifi, a library for finite field arithmetics

    3. 数据分析

    • Calculate minimum dominating sets
    • Calculate a minimum spanning tree with Python
    • Calculate a maximal independent set with Python
    • Simple regression analysis using Python
    • 网页排序算法PageRank
    • 代数方法求PageRank


沪ICP备19023445号-2号
友情链接