绝大多数的生物学指标并不是一个确定的值,而是被假设为一个正态分布。从统计的角度来说,单一测定无法获得这个分布的任何信息。两次以上的测量可以用一定的概率来表示与其与假设分布之间的确信度。测量点越多,测量所得的分布越接近真实的分布。
但测量越多,成本越高。如何平衡成本与确信度即重复次数的下限是实验科学家需要回答的问题。所谓重复“三次”是一般性的共识。但没有绝对的统计学意义。三次和两次在统计上没有跨越到质变的差别。参考著名的统计作图软件graphpad的解释。
Statistics with n=2 - FAQ 591 - GraphPad
如果你想要的话,两次重复就可以表示一个分布。当然很粗糙,但理论上并没有绝对的错误。只是作图的时候不好看。就两个点,取了平均和误差值,还不如直接把两个点都标出来直观。三个点,平均加误差大概比三个点能反映分布吧……graphpad是这么理解的……
再退一步说,什么叫生物学重复?生物学指标符合一个分布,测量值同样在系统误差下符合正态分布。那么,你说的生物学重复是指什么?是指对同一生物学指标在不同个体间的重复,还是对同一个体的相同指标的重复?每个重复代表了不同的涵义。所谓“平行实验组”没有明确到底“平行”的部分是指什么。所谓生物学重复,必须明确是在不同个体间的重复,旨在获得指标在“生物学意义”上的分布。这里的“个体”需要依实验的系统加以分辨。比如测定小鼠的血液指标。如果进行了一次实验,采三次血,或采一次血,分为三个测定组,并不能算是“生物学重复”,只是技术上的重复测量。而如果进行了三次实验,每次实验后进行采血,这样的重复是一定程度上的“生物学重复”,在某些条件下符合“生物学重复”的标准,甚至因为排除了个体差异而更加合适。有时不同层级的“生物学重复”需要叠加或分层次的讨论。很难一概而论。需要根据每个实验的需求精确地设计。
另外,技术性重复和生物学重复因为其意义不同,反映的分布意义不同,所使用的误差值也不同,一般描述为SEM和SD的差别。这是很多对实验中的统计学认识不深的年轻同志们容易混淆的地方。严格地说,绝大多数实验需要同时进行技术性重复和生物学重复以获取可以确信的数据。然而现实操作中不一定如此。一个根本问题在于对实验误差的认识。误差分析是实验设计的重要环节。通过前导实验获得对各个误差的估计,然而判断误差的叠加是否可以忽略某些重复。一般来说,研究的兴趣是生物学误差,这个问题事实上就会转化成是否有必要包括技术性误差的问题。如果技术性误差的数量级远远小于生物学分布本身的偏差,有时会使技术性重复不那么重要。这个问题也需要具体问题具体分析。
LI-COR有一篇不错的说明
Include Both Technical and Biological Replicates in Your Experiment (licor.com)
感谢邀请。希望对你的理解有所帮助。