共找到 11 个提示词
研究方法选择决策指南:定量研究(问卷/实验/二手数据)vs 定性研究(访谈/案例/扎根理论)vs 混合方法→每种方法的适用条件/样本要求/数据分析工具→研究方法与论文类型匹配→避免"方法选择错误"导致后期推倒重来
中国量化数据源全景对比:Wind(全但贵)/Choice(次之)/Tushare Pro(免费好用但限制多)/AkShare(完全免费开源)/Baostock(免费历史行情)/QUANTAXIS(开源数据框架)/米筐&聚宽(平台自带数据).选型决策树+API示例+常见坑点
金融数据获取与清洗方案:股票/基金/期货/宏观数据的免费与付费数据源对比、Python爬取模板(Tushare/AkShare/Baostock/Wind API)、数据清洗pipeline(缺失值/异常值/复权/对齐)。让数据准备从'最耗时的环节'变成'几行代码的事'
系统解读GDP数据:分项拆解、名义与实际增速差异、环比与同比信号含义,结合中国GDP核算特点分析经济真实温度
高频微观结构因子构建:Level2订单簿特征(买卖挂单不平衡/深度/价差)、订单流毒性指标(VPIN/信息交易概率)、高频量价因子(已实现波动/日内动量/开盘效应)、A股Level2数据获取与应用限制
量化投研平台选型与搭建:第三方平台(聚宽/米筐/优矿/掘金/BigQuant)对比、自建平台架构(数据层→研究层→回测层→执行层)、Docker容器化一键部署、个人/小团队/机构三种规模的平台方案.含成本和时间估算
理解并设计Data Mesh架构:去中心化数据所有权→数据即产品→联邦治理→自助数据平台→与传统数据仓库/数据湖的对比→实施路线图→组织架构配合
构建数据质量框架:六维度质量评估(完整性/准确性/一致性/及时性/唯一性/有效性)→自动化质量检查→异常告警→数据血缘→质量Dashboard→Great Expectations/Soda/Deequ工具实战
dbt数据工程实战:项目结构→Model分层(staging/intermediate/mart)→Jinja宏→测试(Generic+Singular)→文档自动生成→增量模型→Snapshot→CI/CD集成→与Airflow/Prefect的配合
设计NLP处理流水线:文本预处理→分词/分句→命名实体识别→关系抽取→文本分类→情感分析→摘要生成→实体链接→多语言支持→模型更新策略→在线vs批处理
描述数据源和清洗目标,自动生成Pandas/NumPy数据处理脚本:缺失值处理→异常值检测→数据类型转换→聚合统计→结果导出。附带数据质量报告