宋河顺手开了一个新程序,按伊雷马实验室数据,同步复现药物预测流程。 别人做的成果,他不敢全盘接收,还是亲自上手验证一下稳妥! 首先是经典的ddis预测,即药物-药物相互作用,探讨病人短时间服用多种药物后,产生的复合效应。 当初在京海大学实验室,吕承恩讲过中药预测五原则,相反为制、相畏为制、相喜为制、相资为制、相恶为制,也是药物和药物相互作用的原理,只不过现代的ddis预测深入到分子层面了。 之前宋河看相关论文时,见过基于图卷积神经网络的ddis预测,以及基于平衡理论的预测。 前者太片面,只考虑邻接矩阵元素。而后者则太绝对,总结起来就是“朋友的朋友是朋友”、“朋友的朋友是敌人”,但实际的药物研发中,关系远比平衡理论要错综复杂。 电脑屏幕上,伊雷马实验室居然两种方法都弃之不用,赫然使用了新方法进行ddis预测! 宋河研读许久,基本明白了思路……大数据库推导! 伊雷马实验室尝试将海量化合物进行拓展,梳理出亲戚关系,画出一个壮观的树状图,每个枝丫都连接一种相似的化合物。 之后,再通过已经确定的化合物药用特性,大胆猜测未知化合物的药效。 这感觉好比,知道丈夫是生物学家,知道妻子是短跑运动员,于是便猜测这对夫妻将来的孙子能够……一边短跑冲刺一边手拿显微镜观察细菌…… 本质上还是瞎猜药物,但在瞎猜中多了一丝丝牵强附会的推理。 “好难!”宋河吐槽。 他在帖子里寻找伊雷马实验室用的大数据库。 找了半天……没找到? “怪不得呢!原来公布的只是边缘数据,最核心的没公布啊!”宋河摇头失笑。 没办法,他只得尝试自己搜集数据库。 他先在网上寻找,用过相似工作方式的科研团队。 花了许久,总共找到两个。 一个是千度公司合作的研发团队,通过大量食管癌病人的数据,寻找到22个显著突变基因,随后预测关联出可行的药物信息。 一个是sk癌症中心,开发了一个体细胞突变相关的知识库,收录了大量靶向药。 “都是做癌症的数据库,用不上啊!”宋河挠头。 思前想后,他掏出手机,找相晓桐老师场外求助。 “老师,我需要一个安眠药相关的大数据库,做药物预测用,您知道从哪能弄到吗?学生万谢!” 刚发消息,宋河马上后悔,大半夜的,会不会打扰老师休息? 没想到过了几秒,回复便来了。 相晓桐:“我知道谭西教授的团队自建了一个安眠药数据库,但谭西那人小心眼,断不可能提供给你。” 相晓桐:“这样吧,我团队里有黑客,帮你上网抓一些相关数据下来,能抓多少不确定,你做个参考。” 宋河连忙回复,“谢谢老师!学生简直不知道该怎么感谢您好了!” 相晓桐:“回头跟着我学脑的时候,好好干活就行。” 一小时后,相晓桐一股脑扔来大堆数据文件。 宋河打开看,每一份文件均为庞然大物! 海量的数据,杂乱不堪,有他想要的化合物分析,有奇奇怪怪的废数据,大部分来自世界各地医药组织的数据库,千奇百怪的语言齐聚一堂,光是机翻都要很久。 如果自己单独干,仅仅梳理完这些数据,恐怕都得拖到过年! 宋河幽幽长叹一声,看来这次做短眠药,必须雇佣实验团队了! 和军用的环形山炸药不同,短眠药这东西主要是商业价值,无需过于水泄不通的保密措施,招些可靠的人手来干活,注意分工即可。 宋河在反间谍教材上,学过一种行之有效的保密方法,盲人摸象法。 大型项目常用这种方法,将工作人员分小组,每组只负责一小部分操作,各小组之间严禁互通消息。 如此一来,所有置身事内的人,只能了解自己眼前的一小部分,无法得知整个项目的全貌,哪怕有个别间谍混入,窃取的消息也远不足以损害全局,甚至会得到误导性的信息。 有点像军舰里的水密隔舱,众多互不相通的舱室,即使其中一两个舱室被鱼类击中进水,其他舱室完好无损,依旧能保持舰体不沉。 计划很美好。 可是,人手去哪雇佣? …… 航天镇,总务楼三楼。 1号办事处。