使用 DeepSeek 爬取新浪财经数据构建股票池的步骤如下:
1. 数据接口选择
核心接口: 实时行情:http://hq.sinajs.cn/list=sh601006(示例代码)
历史 K 线:https://quotes.sina.cn/cn/api/json_v2.php/CN_MarketDataService.getKLineData
参数说明: symbol:股票代码(如 “sz000001”)
scale:周期(5m/15m/30m/60m / 日线)
datalen:数据长度(最大 1023 条)
2. 数据爬取示例代码 import requests
# 获取实时行情
def get_real_time_data(stock_code):
url = f"http://hq.sinajs.cn/list={stock_code}"
response = requests.get(url)
data = response.text.split(',')
return {
"name": data[0],
"price": float(data[3]),
"volume": int(data[7])
}
# 获取历史K线
def get_kline_data(stock_code, period='day', length=1023):
url = f"https://quotes.sina.cn/cn/api/json_v2.php/CN_MarketDataService.getKLineData?symbol={stock_code}&scale={period}&datalen={length}"
response = requests.get(url)
return response.json()
3. 股票池构建流程
1. 板块筛选 用 DeepSeek 自动筛选 “政务信息化” 板块股票(如数字政通、太极股份) 补充财务指标(市盈率、营收增速)
2. 数据清洗 剔除 ST 股、流动性不足标的 处理缺失值(如用前向填充法补全停牌期间数据)
4. 注意事项 数据限制:
历史数据最多获取 1023 条(约 4 年日线数据) 实时行情接口无频率限制,但需控制并发请求替代方案: 结合腾讯自选股 API(需付费)获取更完整数据
提示: 若需全量历史数据,建议结合Tushare Pro(付费)或东方财富网爬虫
合规性:避免高频交易,单账户日请求量建议<1000 次
相关文章









猜你喜欢
成员 网址收录40418 企业收录2986 印章生成263572 电子证书1157 电子名片68 自媒体91237