游乐游手机版
首页/手机教程/文章详情

DeepSeek助力快速生成DNBC4tools所需样本对应信息

时间:2025-07-04 12:34
工欲善其事 必先利其器前面我们介绍了华大 DNBelab C SeriesTM 单细胞转录组定量的基本流程: DNBC4tools—华大DNBelab系列单细胞分析pipeline

工欲善其事 必先利其器

前面我们介绍了华大 DNBelab C SeriesTM 单细胞转录组定量的基本流程: DNBC4tools—华大DNBelab系列单细胞分析pipeline

明确需求

其中在准备样本数据步骤有提到,多样本处理首先需要制作一个自己的样本信息对应列表sample.tsv :

第一列是样本名称第二列是 cDNA 文库测序数据,多个 fastq 文件以逗号分隔,R1 和 R2 文件以分号分隔。第三列是寡核苷酸文库测序数据。多个 fastq 文件以逗号分隔,R1 和 R2 文件以分号分隔。

比如我需要处理的样本文件名是:

DeepSeek助力快速生成DNBC4tools所需样本对应信息图片

需要生成的sample.tsv 文件格式是:

代码语言:javascript代码运行次数:0运行复制
$sample1 /data/cDNA1_R1.fq.gz;/data/cDNA1_R2.fq.gz /data/oligo1_R1.fq.gz,/data/oligo4_R1.fq.gz;/data/oligo1_R2.fq.gz,/data/oligo4_R2.fq.gz $sample2 /data/cDNA2_R1.fq.gz;/data/cDNA2_R2.fq.gz /data/oligo2_R1.fq.gz;/data/oligo2_R2.fq.gz $sample3 /data/cDNA3_R1.fq.gz;/data/cDNA3_R2.fq.gz /data/oligo3_R1.fq.gz;/data/oligo3_R2.fq.gz
登录后复制

我们现在需要根据样本文件名规律来生成示例文件的对应信息。手写是不可能手写的,容易出错不说,还不能重复。这里通常需要我们来编程批量进行文本处理。

DeepSeek 助力

初步观察这个需求实现起来还是挺复杂的,以前往往需要花费一定时间来进行代码实现。现在AI盛行,这个时候我们就可以使用DeepSeek来快速生成我们需要的代码。比如下面的代码:

代码语言:javascript代码运行次数:0运行复制
ls *.gz | awk -F_ 'BEGIN {OFS="\t"} {    sample = $1;    lib = $2;    split($3, temp, ".");    direction = temp[1];        all_samples[sample] = 1;        if (lib ~ /^L[0-9]+/) {        lib_num = substr(lib, 2) + 0;  # 提取L后面的数字                # 记录文库顺序        if (!(sample SUBSEP lib_num in lib_seen)) {            libs_order[sample] = libs_order[sample] ? libs_order[sample] " " lib_num : lib_num;            lib_seen[sample, lib_num] = 1;        }                # 存储文件路径        if (direction == "f1") {            f1_files[sample, lib_num] = $0;        } else if (direction == "r2") {            r2_files[sample, lib_num] = $0;        }    } else if (lib == "oligo") {        if (direction == "f1") {            oligo_f1[sample] = $0;        } else if (direction == "r2") {            oligo_r2[sample] = $0;        }    }}END {    for (sample in all_samples) {        # 处理L00数据        l00_f1 = "";        l00_r2 = "";                if (sample in libs_order) {            split(libs_order[sample], lib_nums, " ");            n = length(lib_nums);                        # 冒号排序确保文库顺序            for (i=1; i<=n; i++) {                for (j=1; j<=n-i; j++) {                    if (lib_nums[j+1] < lib_nums[j]) {                        tmp = lib_nums[j];                        lib_nums[j] = lib_nums[j+1];                        lib_nums[j+1] = tmp;                    }                }            }                        # 构建f1和r2列表            for (i=1; i<=n; i++) {                num = lib_nums[i];                if ((sample, num) in f1_files) {                    l00_f1 = l00_f1 ? l00_f1 "," f1_files[sample, num] : f1_files[sample, num];                }                if ((sample, num) in r2_files) {                    l00_r2 = l00_r2 ? l00_r2 "," r2_files[sample, num] : r2_files[sample, num];                }            }        }                # 合并L00字段        l00_combined = l00_f1 ";" l00_r2;                # 处理Oligo数据        oligo_data = "";        if (oligo_f1[sample] && oligo_r2[sample]) {            oligo_data = oligo_f1[sample] ";" oligo_r2[sample];        }                print sample, l00_combined, oligo_data;    }}'  > sample2.tsv
登录后复制

快速得到我们需要的样本对应信息文件sample2.tsv :(检查文件信息)

代码语言:javascript代码运行次数:0运行复制
$cat sample2.tsv D10     D10_L001_f1.fq.gz,D10_L002_f1.fq.gz;D10_L001_r2.fq.gz,D10_L002_r2.fq.gz D10_oligo_f1.fq.gz;D10_oligo_r2.fq.gzD15     D15_L001_f1.fq.gz,D15_L002_f1.fq.gz;D15_L001_r2.fq.gz,D15_L002_r2.fq.gz D15_oligo_f1.fq.gz;D15_oligo_r2.fq.gzD5-2    D5-2_L001_f1.fq.gz,D5-2_L002_f1.fq.gz;D5-2_L001_r2.fq.gz,D5-2_L002_r2.fq.gz     D5-2_oligo_f1.fq.gz;D5-2_oligo_r2.fq.gzD2-1    D2-1_L001_f1.fq.gz,D2-1_L002_f1.fq.gz;D2-1_L001_r2.fq.gz,D2-1_L002_r2.fq.gz     D2-1_oligo_f1.fq.gz;D2-1_oligo_r2.fq.gzD8-2    D8-2_L001_f1.fq.gz,D8-2_L002_f1.fq.gz;D8-2_L001_r2.fq.gz,D8-2_L002_r2.fq.gz     D8-2_oligo_f1.fq.gz;D8-2_oligo_r2.fq.gzD5-1    D5-1_L001_f1.fq.gz,D5-1_L002_f1.fq.gz;D5-1_L001_r2.fq.gz,D5-1_L002_r2.fq.gz     D5-1_oligo_f1.fq.gz;D5-1_oligo_r2.fq.gzD2-2    D2-2_L001_f1.fq.gz,D2-2_L002_f1.fq.gz;D2-2_L001_r2.fq.gz,D2-2_L002_r2.fq.gz     D2-2_oligo_f1.fq.gz;D2-2_oligo_r2.fq.gzD12     D12_L001_f1.fq.gz;D12_L001_r2.fq.gz     D12_oligo_f1.fq.gz;D12_oligo_r2.fq.gzD8-1    D8-1_L001_f1.fq.gz,D8-1_L002_f1.fq.gz;D8-1_L001_r2.fq.gz,D8-1_L002_r2.fq.gz     D8-1_oligo_f1.fq.gz;D8-1_oligo_r2.fq.gz
登录后复制

然后就是批量生成运行脚本代码语言:javascript代码运行次数:0运行复制

dnbc4tools rna multi --list sample2.tsv --genomeDir ~/reference/human/homo_ensembl_112_dnbc4_index --threads 10
登录后复制

DeepSeek助力快速生成DNBC4tools所需样本对应信息示例

示例

至此,后面提交批量运行任务即可。详见:

DNBC4tools—华大DNBelab系列单细胞分析pipeline玩转服务器—从前台到后台,让你的任务无忧运行
来源:https://www.php.cn/faq/1384552.html
上一篇DeepSeek‑R1-0528 重磅升级:蚂蚁百宝箱免费、无限量调用 下一篇千万别用DeepSeek写论文!!!
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
手机教程 · 2026-06-30

百度街景功能详解与实景地图应用场景指南

出门前想确认酒店门口好不好停车、餐厅招牌挂在哪一边、或者提前“走一遍”陌生地铁站的出口——这些需求,百度街景功能都能满足。它不是静态图片,而是一张可拖拽、可缩放、带时间戳的360度实景地图,直接把真实街道拉到手机屏幕上。不过,这个功能默认是隐藏的,需要手动打开。 打开街景的三种常用路径 方法一:图层

手机教程 · 2026-06-30

中羽论坛备用入口稳定访问方式完整指南

相信不少羽毛球爱好者都遇到过这样的情况:常逛的羽毛球论坛突然打不开,或者域名更换后一时找不到新入口,心里难免着急。中羽论坛作为国内羽毛球圈重要的社区平台,它的备用入口稳定访问方式在哪里?直接给出答案:https: www badmintoncn com,这个网址是目前最可靠的稳定入口。解决了访问“

手机教程 · 2026-06-30

TapTap老版本官方下载方法 历史版本降级详细教程

想恢复 TapTap 老版本界面、规避新版本强制推送与社区限流,却找不到官方历史安装包入口?这是许多用户遇到的常见问题——目前 TapTap 官网及应用商店已全面下架旧版 APK 下载渠道。实际上,在豌豆荚「历史版本大全」专题页面中,仍可获取完整的老版本资源。只需认准 wandoujia com 域

手机教程 · 2026-06-30

百度街景多久更新一次实景拍摄频率解析

你是否好奇,家楼下新开的奶茶店是否已被百度街景收录?或者导航地图上那个施工围挡,究竟是上周刚竖起的,还是去年拍摄的旧画面?这个问题的答案,直接取决于百度的街景更新策略——官方虽未公布统一周期,但如果你住在北上广深的核心城区,主干道每三个月重采一次已是常态;而换到县城的一条小巷,五年未更新的老数据也毫

手机教程 · 2026-06-30

小米商店查看并删除应用购买记录的方法

小米应用商店的购买记录并没有独立设置一个“查看入口”,而是整合在小米账户的订单体系之中。若想删除这些记录,需要先打开小米商城App,依次进入“我的→全部订单→筛选‘应用 服务’→选择对应订单→删除”。至于设备本地显示的购买标识,可以通过清除应用存储来强制刷新。而对于自动续费类的订阅服务,则必须前往小