当前位置:主页 > bet36备用网站 >
对于初学者提示,请不要从不必要的数据集开始
浏览: 发布日期:2019-02-14
初学者对数据的破坏真的很吓人!
今天,一年四季潜水的粉丝突然跟我说话,说他的思维方式崩溃了。他认为它不适合数据处理。即使在一年多之后,他也觉得自己并没有真正做任何事情。
请让我再次思考一下我的误解误解。
基本素质的价值是非常糟糕的,GC是不平衡,有一个会议,PCR的重复的时候,k聚值也有很大不同,短短几个月的时间,结果花费在质量管理是不理解,几个调查信息将继续在该地方轮换。
因为它是一个类似于寻找不同基因的转录组,实验设计者没有设计迭代,案例,控制,羊毛。即使存在重复,组内的相关性也非常差并且不是很好。作为对照,并且因为每个样本的序列非常矛盾和令人头疼,所以比较效率低,你会怀疑你的生活。使用参考基因??组是错误的吗?或者就像垃圾一样,即使参考也找不到它,它在每个门外都晕倒了。最后,我选择了适当的方法找到差异的基因,而且,只要有一个很大的区别的一点点,或10,000以上发现它是非常重要的,哭了!
为了找到峰值数据分析相同的码片序列是指20M?50M的数据,结果也分为批次,一旦10M,一旦7M,呼叫被单独分离的,一个样品是几千键即便如此,我们也不会牺牲峰值数量,因此我们需要通过查看MACS 2源代码来绘制圆圈。Lambda,峰的数量似乎是俄罗斯的一座山。我正在精彩地看着IGV。控制和箱控制和峰值完全相同
~~~~哦,天啊!
分析肿瘤外显子数据更有意思,即使现在我仍然有一个糟糕的实验设计!
幸运的是,如果有很多例子你和我可以在你的博客上快速重复,请附上如下代码:
Http://www.bio-info-trainee.com/(阅读原版直播)
当然,我不会为初学者写两个小时。即使您未在2小时内完成,也不要感到沮丧。,我和其他许多人总是喜欢向初学者说些什么,请原谅。它非常简单。
此外,我们旧论坛还有一些实际项目。http://www.biotrainee.com/forum-108-1.html
我也想帮助你,初学者,我想要善待你!
如果您有关于自己的生物信息学的难忘故事,请分享信息区域或发送电子邮件给我!