使用DeepSeek自动做基线人口学特征表并生成word文档

真实世界研究 2025-03-24 12:51:05

DeepSeek 可以做一切统计学分析。但是很多人不会用,因为撰写提示词 prompt需要一定的统计学知识,这就成为了非统计小白使用 Deepseek 的门槛,也成为了统计师失业最后的护城河。

www.mstata.com 增加了 DeepSeek 统计学插件,导入自己的数据集,让大家和 DeepSeek 对话完成统计分析时,同时调用后台的 R 软件进行实时分析,并将分析结果整理输出为 word 文档。

本公众号现在分期介绍一些实用的 DeepSeek 的 prompt 模板。第一期先介绍如何一句话完成基线人口学特征表的制作:

进入www.mstata.com, 左上角选择进入Mstata 医学统计机器人,菜单选择“数据准备”,导入数据后,选择“定义字段”, 正确定义好连续性变量和分类变量后,点击 “deepseek 自动统计分析工具” 菜单,进入页面并选择一个基线特征表的prompt 模板:

下拉到 DeepSeek 对话窗口:

粘贴 prompt 命令:

请用'Treatment'分组,对'Age','Sex','extent'做基线人口学特征表,添加P值,P值保留三位小数

输入命令后回车,软件给出 R 代码并运行:

连续性变量一般根据是否正态分布,用均值标准差,或者中位数(IQR)描述,用参数法,或者非参数法描述。

如果需要精确控制每个变量用的统计方法,可以尝试换用以下 prompt :

请用'Treatment'分组,对'Age','Sex','extent'做基线人口学特征表,添加P值,P值保留三位小数,连续性变量用均值标准差描述,用参数法比较p值

请用'Treatment'分组,对'Age','Sex','extent'做基线人口学特征表,添加P值,P值保留三位小数,连续性变量用中位数(IQR)描述,用非参数法比较p值

请用'Treatment'分组,对'Age','Occurrence', 'Sex','extent'做基线人口学特征表,添加P值,P值保留三位小数,'Age' 用均值标准差描述,用参数法比较p值,'Occurrence'用中位数(IQR)描述,用非参数法比较p值

如果想先检测下正态性,再做决定,可以用以下prompt:

做QQ图检测一下'Age'和'Occurrence' 的正态性

根据以上图片,先判断变量的正态性,然后再给 Deepseek 具体的指令如何做基线表,也是可以的。

当然,也可以直接命令Deepseek 先做正态性检验,然后根据检验结果自动选择参数法还是非参数法进行基线表的制作,也是可以的。

最后,直接点击下载 word 文件,即可:

0 阅读:4

真实世界研究

简介:介绍真实世界数据、真实世界研究和生物统计学知识