2023.06.17【读书报告】|AI辅助写统计脚本

摘要

搭建流程的时候我们一般生成的原始结果需要进行统计整理,一方面用于图片绘制,另一方面生成报告,让客户容易读懂。以往都是工程师自己先熟悉结果文件,再进行统计。通过AI工具,我们可以快速生成统计脚本。

选择AI聊天工具,进入聊天框(三选一)

    a. 进入网站 [BAI - The AI solution for EVERYONE (theb.ai)](https://theb.ai/#/chat/1002) 
    
    b. 打开Microsoft加载项,搜索“Monica”并安装
    
    c. 打开VS code ,选择“扩展”,搜索“chat-GPT 中文版”并安装

这三种方式都无需注册账户。不过a需要,c需要有一些vs code使用基础。b最好用,有侧边栏和聊天窗口两种模式,适合小白。
2023.06.17【读书报告】|AI辅助写统计脚本_第1张图片

输入GPT命令

    a. 身份切换:“请切换为工作十年经验的生物信息工程师”
    # 不切换也能生成代码,但是写出来的效果有偏差,也有可能切换成程序员代码书写会更规范。
    b. 提供代码生成prompt:“请编写一个 [编程语言] 脚本,使用 [输入文件] 执行 [任务],要求:[输出格式]。”
        例:请帮我写一个python脚本,统计在03.callpeak文件内所有样品子目录中的peak结果,结果为macs2输出的narrowpeak后缀文件,统计格式如下:“Sample	Number	Min_length	1st_quarter_length	Median	Mean	3rd_quarter_length	Max_lengthC1	377	73	86	108	141.66578249	153	1390C2	259	66	78	96	125.75289575	136	963T1	222	62	71	86	107.49549549	126	568T2	685	60	69	81	102.29927007	108	707“
       
       #将案例做了一个梳理,需要注意的是输入、输出文件路径、格式描述越清楚,代码可行性越高。
            编程语言:python
            输入文件:03.callpeak/{samples}/samples_peaks.narrowPeak
            执行任务:统计peak结果
            统计格式:
                “Sample	Number	Min_length	1st_quarter_length	Median	Mean	3rd_quarter_length	Max_lengthC1	377	73	86	108	141.66578249	153	1390C2	259	66	78	96	125.75289575	136	963T1	222	62	71	86	107.49549549	126	568T2	685	60	69	81	102.29927007	108	707“



    c. 得到统计脚本

测试/调试脚本

    a. vi建立空白脚本文件(.sh .R .py),调整脚本内部文件路径;
        '/path/to/sample1' 
    b. 确认脚本执行路径(默认在项目主路径下执行),如果统计文件能够顺利生成,可调整内部文件路径后放入scripts对应子目录中。
    c. 打开统计文件,检查结果

总结

这里主要总结的是统计脚本,因为统计这方面AI工具犯错少,如果是绘图脚本就比较复杂,一是太简单的图很丑需要调,二是参数容易搞混,经常反复改,甚至不如直接搜索引擎上找。总的来说,统计脚本用AI工具还是可以提升生产效率的,熟练使用流程可能10分钟就能运行出来,但是写一个可能就1小时起了。欢迎大家加VX:bbplayer2021 (木青)进社区交流。

你可能感兴趣的:(人工智能)