分享
(社区版)基于 ModelWhale 的 DeepAnalyze-8b 使用指南
输入“/”快速插入内容
🐋
(社区版)
基于 ModelWhale 的
DeepAnalyze-8b 使用指南
用户3072
用户3072
用户4731
用户4731
用户692
用户692
3月24日修改
👨💻
项目源地址:
https://github.com/ruc-datalab/DeepAnalyze
本文档用于演示如何在和鲸 ModelWhale 平台上调试 DeepAnalyze 代码并部署应用。
你可以借助本文档实现在线快速复现 demo 应用搭建
。
使用的 DeepAnalyze-8B 模型已在 ModelWhale 平台完成部署。DeepAnalyze api key 可通过
填写表单
或联系和鲸工作人员获取。
🤹♀️ 文档作者与 demo 开发者
: 李浩鸣
,
现任上海和今信息科技有限公司(和鲸科技)AI数据工程师,香港城市大学数据科学硕士。专注于大模型与智能体系统开发,具备完整的LLM应用落地经验。在DeepAnalyze生态中负责模型在ModelWhale平台的部署,前端交互和应用迭代。曾参与高并发智能编程助手服务构建,技术栈涵盖FastAPI、LangChain、LangGraph等技术框架,实现大模型集成、流式输出与状态管理。精通Hadoop/Spark数据生态,具备海量数据ETL开发与数仓运维经验,擅长从算法研发到业务交付的全流程工程实现,致力于推动数据智能系统的稳健落地与性能优化。github 主页:
https://github.com/LHMQ878
模型背景
DeepAnalyze是
首个用于自主数据科学的智能体大模型(Agentic LLM)
,可在无人工干预的情况下自主完成各类以数据为核心的任务,核心能力/特点包括:
1.
覆盖完整数据科学 pipeline
:自动执行数据准备、分析、建模、可视化、报告生成等全流程数据科学任务;
2.
支持开放式数据研究
:对结构化(数据库、CSV、Excel)、半结构化(JSON、XML、YAML)、非结构化(TXT、Markdown)等多样数据源开展深度研究,最终产出“分析师级”研究报告;
3.
完全开源
:模型、代码、训练数据、演示(demo)均开源,允许用户部署或扩展自己的数据分析助手。
模型官方资料:
•
模型 / demo:
https://huggingface.co/RUC-DataLab/DeepAnalyze-8B
•
代码:
https://github.com/ruc-datalab/DeepAnalyze
•
训练数据:
https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K
0. api 接口
请求
提供
两种
调用方案:
0.1 纯 prom
p
t 版请求示例
notebook codecell 调用格式
Python
!curl -X POST https://www.heywhale.com/api/model/services/691d42c36c6dda33df0bf645/app/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer
your_api_key
" \
-d '{"messages": [{"role": "user", "content": "你是谁?"}]}'
terminal 调用格式
Bash
curl -X POST "https://www.heywhale.com/api/model/services/691d42c36c6dda33df0bf645/app/v1/chat/completions" -H "Content-Type: application/json" -H "Authorization: Bearer
your_api_key
" -d "{\"messages\": [{\"role\": \"user\", \"content\": \"tensorflow是什么?\"}]}"
0.2 prompt+上传文件版请求示例:
da_quick_start.zip
101.36KB
下载zip文件到本地后,在当前文件夹下
1.
运行脚本
:
代码块
Bash
python test_streaming.py
2.
按提示操作
:
- 输入API密钥
- 选择对话类型(1=无文件对话,2=文件分析)
- 如选择2,输入文件路径(支持逗号分隔多个文件)
- 输入分析指令(可选,留空使用默认指令)
📝 使用示例
示例1:分析CSV文件
代码块
YAML
python test_streaming.py
# Enter API Key: your_api_key
# Enter choice (1 or 2): 2
# Enter file paths: Simpson.csv
# Enter analysis instruction: [留空或输入自定义指令]
示例2:分析ZIP压缩包
代码块
YAML
python test_streaming.py
# Enter API Key: your_api_key
# Enter choice (1 or 2): 2
# Enter file paths: example.zip
# Enter analysis instruction: [留空或输入自定义指令]