共找到 13 个提示词
另类数据量化投资指南:卫星图像分析(港口/油田/农田/商圈人流)、信用卡消费数据(行业景气度推断)、招聘网站数据(企业扩张/收缩信号)、社交媒体舆情(微博/小红书/抖音品牌热度)。从获取到因子化的完整pipeline
原油基本面全维度拆解:全球供需平衡表的编制方法→OPEC+产量政策与减产纪律→EIA周度库存数据的市场影响→API与EIA库存偏差的规律→中国原油进口量与地炼开工率的信号意义
中国量化数据源全景对比:Wind(全但贵)/Choice(次之)/Tushare Pro(免费好用但限制多)/AkShare(完全免费开源)/Baostock(免费历史行情)/QUANTAXIS(开源数据框架)/米筐&聚宽(平台自带数据).选型决策树+API示例+常见坑点
金融数据获取与清洗方案:股票/基金/期货/宏观数据的免费与付费数据源对比、Python爬取模板(Tushare/AkShare/Baostock/Wind API)、数据清洗pipeline(缺失值/异常值/复权/对齐)。让数据准备从'最耗时的环节'变成'几行代码的事'
生猪期货实战手册:猪周期(4年一轮)的形成机制与当前阶段定位→能繁母猪存栏(统计局+农业农村部)对价格的领先意义→DCE生猪期货(LH)合约的特殊性(吨/手/生鲜品)→养殖企业套期保值的实战方案→猪粮比/猪料比与养殖利润分析
财经NLP实战应用:新闻情绪因子构建(正面/负面/中性分类与打分)、财报电话会议纪要情感抽取、券商研报文本挖掘(评级变化/目标价修正/关键段落提取)、FinBERT等预训练模型微调、文本因子与量价因子的结合策略
系统梳理量化因子体系:价值因子(BP/EP/CFP)、动量因子(过去N月收益/均线偏离)、质量因子(ROE/毛利率/杠杆率)、波动率因子(已实现波动/下行波动)、规模因子(对数市值)。含计算代码和A股因子特征差异
设计数据湖架构:数据湖vs数据仓库的选择→分层存储(Bronze/Silver/Gold)→Delta Lake/Iceberg/Hudi表格式→Schema演进→ACID事务→元数据管理→数据治理→查询引擎(Trino/Presto/Spark)
理解并设计Data Mesh架构:去中心化数据所有权→数据即产品→联邦治理→自助数据平台→与传统数据仓库/数据湖的对比→实施路线图→组织架构配合
构建数据质量框架:六维度质量评估(完整性/准确性/一致性/及时性/唯一性/有效性)→自动化质量检查→异常告警→数据血缘→质量Dashboard→Great Expectations/Soda/Deequ工具实战
分析异常堆栈跟踪:解读堆栈每层的含义→追溯根因(不是报错的那行,是真正出错的地方)→分析触发条件→给出修复方案→提供预防同类错误的建议
设计ML工程流水线:数据采集→特征工程→训练→评估→部署→监控→模型更新。涵盖Feature Store、MLflow实验管理、模型版本化、A/B测试部署、数据漂移检测
描述数据源和清洗目标,自动生成Pandas/NumPy数据处理脚本:缺失值处理→异常值检测→数据类型转换→聚合统计→结果导出。附带数据质量报告