excel学习库

excel表格_excel函数公式大全_execl从入门到精通

重命名人类基因比对抗Excel更容易

人类基因组中有数以万计的基因:微小的 DNA 和 RNA 片段,它们编码使我们每个人都独一无二的所有特征和特征。每个基因都有一个名称和一个字母数字代码。但在过去的一年里,有 27 个人类基因被重新命名。你会惊讶地知道原因。事实上,Microsoft Excel... 会自动替换一些基因名称,将它们变成日期!

Excel 是一种流行的电子表格程序,科学家经常使用它也就不足为奇了。他们在那里输入数据,甚至使用 Excel 进行临床试验。但事实是 Excel 是为更平凡的任务而设计的。而当用户在电子表格中输入基因的字母数字名称时,例如 MARCH1(“ Membrane Associated Ring-CH-Type Finger 1 ”的缩写),Excel 会将其转换为日期:3 月 1 日。

这样的错误很关键,因为为了纠正扭曲的数据,科学家们不得不手动对所有信息进行分类。这不仅乏味,而且不切实际。然而,即使在同行评审的科学论文中,这种错误也出奇地普遍。2016 年的一项研究 查看了与 3,597 篇科学论文一起发表的基因数据,发现大约五分之一的数据被 Excel 错误损坏。

这个问题没有简单的解决方案。Excel 中没有关闭自动格式设置的选项,避免它的唯一方法是 更改 各个列的数据类型。 即使在这种情况下,科学家也可以更正他的数据,但将其导出为 CSV 文件而不保存格式将不起作用。或者另一位科学家可能会在没有正确格式的情况下上传数据,不小心将基因符号替换为日期。

该决定来自负责标准化基因名称的科学机构 HUGO 基因命名委员会或 HGNC。HGNC 已经发布了关于基因命名的建议 ,包括“影响数据处理和检索的字符”。从现在开始,人类基因和它们表达的蛋白质将以Excel的自动格式化命名。 这意味着字符 MARCH1 现在将变为 MARCHF1,而 SEPT1 将变为 SEPTIN1,依此类推。旧字符和名称的记录将保存在 HGNC 中以避免将来混淆。

这些变化已经影响了 27 个基因的名称, 但“更名”的原则并未立即正式公布。命名基因的原则很大程度上基于共识。基因命名委员会必须倾听受工作影响最大的人们的需求。

并非总是这样。在遗传学的早期,基因命名通常是 创造性科学家的沙盒,导致诸如“刺猬索尼克”(是的,以 同一个索尼克命名)和“印地”(“我没死”的缩写)等臭名昭著的名字。然而”)。”在俄语中“我还没有死”),这是对基因功能的引用,它在突变时使果蝇的寿命加倍。看起来它看起来很有趣,但科学家们当然知道得更多。

但是 HGNC 已经将事情掌握在自己手中,目前的规则没有给异想天开或自私(和幻想,唉)留下任何余地。重点是实际问题:如何最大程度地减少混乱?为此,基因的符号应该是唯一的,名称应该简短而具体。它们不能使用下标或上标,只能包含拉丁字母和阿拉伯数字,并且不得包含名称或单词,尤其是冒犯性的(任何语言)。

虽然重命名基因的决定并不容易,但这并不罕见。例如,许多可以读作名词的基因符号已被重命名,以避免在搜索过程中出现误报。过去,CARS变成了CARS1,WARS变成了WARS1,MARS变成了MARS1。进行了其他更改以避免侮辱。

为什么遗传学家输给了微软

是的,这个决定引起了一些争议,主要是因为重命名人类基因比改变 Excel 的工作方式更容易。为什么科学家们不得不屈服?

微软没有回应置评请求,但做出改变真的没有意义。处理基因只是 Excel 软件的一种用途。微软几乎没有动力对庞大社区的其他成员极其广泛使用的功能进行重大更改。所以科学家们不应该等待问题得到解决的假设更新。此外,他们自己可以提供一个长期的解决方案。Microsoft Excel 只能存在有限的时间,而人类基因将持续存在,只要我们还活着。最好给他们起有效的名字。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接