法律概率主义(二)
比较了给出了两个假设的相同证据e的概率。 后差
pr(h|e)
pr(h'|e)
鉴于证据,比较假设的概率。 对于证据,该比率与特定假设的概率Pr(H蜂)不同。
作为一个插图,考虑莎莉克拉克案(先前在§1.2中讨论)。 比较的两个假设是莎莉克拉克的儿子死于自然原因(自然),克拉克杀死了它们(杀死)。 可用的证据是,两个儿子在类似的情况下死于另一个(两次死亡)。 贝叶斯定理(在赔率版本中),
PR(杀死|杀死|死亡)
Pr(天然|毒性死亡)
=
PR(两死亡人类)
Pr(两死亡|自然)
×
pr(杀死)
pr(自然)
。
可能性比率
PR(两死亡人类)
Pr(两死亡|自然)
比较每个假设下证据(两种死亡)的可能性(杀死诉自然)。 由于在任何假设下,两个婴儿都会死于天然原因或杀戮 - 比例应该等于一个(DAWID 2002)。 现有的赔率如何
pr(杀死)
pr(自然)
?
回想起儿科罗伊草甸给出的1 /(73×106)图。 这个数字旨在传达这两个婴儿会死于自然原因的程度不太可能。 如果它不太可能死于自然的原因,那么可能是可能的 - 这一定可能是他们实际上没有死于自然的原因,并且很可能克拉克杀死了他们。 但她是谁?
他们死于自然原因的现有概率应该与母亲会杀死它们的前几个概率。 为了有一个粗略的想法,假设在像英国100万婴儿这样的中等国家,每年都是由母亲谋杀的人。 因此,母亲将在一年中杀死一个婴儿的机会是10,000人。 同一个母亲杀死了两个婴儿的机会是什么? 说我们呼吁(争议)独立的假设。 在这个假设上,母亲杀死两个婴儿的可能性等于1亿岁。 假设独立,
pr(自然)=
1
73×106
和
pr(杀死)=
1
100×106
。
这意味着现有的赔率将相等.73。 似然比的似然比,后赔率也将相等.73。 在这种分析上,克拉克杀死了她的儿子将比他们死于自然原因的可能性,或换句话说,自然原因假设的可能性比克拉克杀死她的儿子的假设更可能是1.37倍。
应牢记这种分析的限制。 .73比率是与另一个假设的概率的衡量标准。 从该比率单独,不能推导各个假设的后验概率。 只有在竞争假设H和H'是独家和详尽的穷举中,说一个是对另一个的否定,后概率可以源于后差异
采购订单=
p(h|e)
p(h'|e)
通过平等
pr(h|e)=
采购订单
1 +宝
。
但假设杀死和自然并非详尽无遗,因为这两个婴儿可以以其他方式死亡。 所以后赔率
PR(杀死|杀死|死亡)
Pr(天然|毒性死亡)
不能翻译成单个假设的后验概率。 (§3.3提供了更复杂的概率分析。)
1.4数字来自哪里?
在到目前为止考虑的示例中,基于经验频率和专家意见的概率分配了概率。 例如,只使用只有5%拥有特定血型的专家证据来设置Pr(M |)=。05。 概率也在常识的基础上分配,例如,Pr(M |s)被设定为1,假设如果有人是犯罪痕迹的来源,则该人必须与犯罪痕迹相匹配(放弃框架的可能性,制作痕迹或假底片的可能性在测试结果中)。 但不必总是分配精确值的概率。 同意确切的价值实际上是非常困难的,特别是对于先前概率。 这对法律概率主义是一项挑战(见§7.3以后)。 避难这种挑战的一种方法是避免设置精确值并采用合理的间隔。 该方法是基于灵敏度分析,评估先前概率如何影响其他概率。
考虑父亲案态v。Boyd(331 N.W.2D 480,Minn。1983)。 专家证人Polesky博士证明了1,121个无关的人必须从一般人群中随机选择另一个人可以找到所有适当的基因,以赋予孩子的孩子。 这种制剂可以误导,因为匹配的DNA配置文件的预期数量不需要与群体中实际发现的匹配曲线的数量(否则思维错误称为预期值谬误)。 在更加仔细的制定中,随机人将成为匹配的概率是1/1121,或者在符号中,
pr(m|¬father)=
1
1121
。
如§1.2.3之前的说明,这种概率不能轻易翻译成遗传外形匹配是父亲的概率,或者在象征中,pr(父亲| m)。 后者应使用贝叶斯定理计算:
pr(father|m)=
pr(m|father)×pr(父亲)
pr(m|father)×pr(父亲)+ pr(m|not父亲)×pr(不父亲)
在实际实践中,建立父亲的公式更复杂(Kaiser和Seber,1983),但为了说明,我们摘要远离这种复杂性。 假设被告是父亲的先前可能性低于.01,或在符号中,Pr(父亲)=。01。 将此现有概率插入贝叶斯定理,以及PR(MSFATHER)= 1和PR(M | Naot-Daight)= 1 / 1,121,给出等于约0.92的PATERNITY PR(父亲)的概率。
但为什么采取先前的概率PR(父亲)是.01而不是别的东西? 敏感性分析的想法是看一系列合理的概率分配,并调查这种选择的影响。 在法律申请中,关键问题是对被告最有利的任务仍将对被告返回强有力的证据案件。 在手头的情况下,专家证词是如此强大的是,对于现有概率Pr(父亲)的广泛频谱,后验概率Pr(父亲| M)保持高,因为图1中的曲线显示。
曲线图标题为父病例的灵敏度分析:X轴被标记为P(父亲),从0到1; y轴被标记为p(姓氏),然后从0到1开始。该行从0,0到差点升高到0.1然后几乎水平到1,1
图1
后续超过.9一旦先前高于约0.008。 在父亲的情况下,鉴于母亲的证词和其他证据,很明显,在专家证词之前父亲的概率应该高于那个,无论什么是先前的概率应该是什么。 在不沉降确切值的情况下,高于.008的价值间隔将保证父亲的后验概率至少为.9。 这充分利用足以满足治理民事案件(如父亲纠纷)(证明标准,请参阅第5节的后面5)的优势标准
1.5来源,活动和冒犯水平假设
评估概率的困难在手中掌握,选择兴趣的假设。 对于一些近似,假设可以分为三个级别:冒犯,活动和源级假设。 在进攻层面,问题是被告是否有罪,就像在“史密斯犯有过失杀人犯罪”的声明中。 在活动水平,假设描述了发生的事情以及所涉及的是或没有做的事情。 活动水平假设的一个例子是“史密斯刺伤了受害者”。 最后,源级假设描述了迹线的源,例如“受害者离开了场景的污渍”,而不指定迹线如何到达那里。 忽视假设水平的差异可能会导致严重的混淆。
考虑一个DNA匹配是主要有罪的证据。 DNA证据是目前可用的最广泛使用的定量证据之一,但它与血迹或其他形式的追踪证据不同。 在作证关于DNA匹配的情况下,试验专家通常会评估随机人,与犯罪无关的可能性会恰逢犯罪污染曲线(Forman等人2003)。 这被称为基因型概率或随机匹配概率,这可能极低,大约为1百万甚至更低(Donnelly 1995; Kaye和Sensabaugh 2011; Wasserman 2002)。 将随机匹配概率与PR(M |innocence)等同诱人,以及先前的PR(无罪)使用贝叶斯定理来计算无罪的PR(InnocenceSm)的后验概率。 这将是一个错误。 应用贝叶斯定理当然推荐并有助于避免检察官的谬论,Pr(Innocence`m)和Pr(m |innocence)的混合。 这里的问题在于其他地方。 将随机匹配概率与PR(M | Incence)等同于冒犯,活动和源级假设之间的差异。 DNA匹配不能直接与内疚或纯真的问题说话。 即使嫌疑人是现场遗传物质的来源,比赛也没有确定被告确实参观了现场并与受害者接触,即使他们这样做,也没有遵循他们被指责的罪行。
少数形式的证据可以直接与冒犯水平假设说话。 概率量化的间接证据,例如DNA匹配和其他痕量证据,并不是。 目击者证词可能会更直接地发言给冒犯水平假设,但它也不太容易达到概率量化(参见Friedman 1987,由Wixted和Wells 2017的最新结果,以及Urbaniak等人的调查。2020)。 这使得难以将概率分配给进攻级别假设。 超越源级假设需要在科学家,调查员和律师之间密切合作(参见Cook等人1998年讨论)。
2.证据的力量
假设的后验概率不应与有利于假设的证据的力量(或妨碍价值,重量)混淆。 证据项目的强度反映了对假设的可能性的影响。 假设H的现有概率非常低,说PR(H)=。001,但取证E考虑到这一概率高达35%,即Pr(H | E)=。35。 这是一个戏剧性的向上班次。 尽管H给出的H的后验概率并不高,但e强烈地利用H.本节审查了概率理论如何有助于评估证据的强度。
2.1贝叶斯因子v。似然比
证据强度的概念 - 与先前和后验概率不同 - 可以以多种不同的方式正式捕获(如对于全面讨论,请参阅确认理论的条目)。 证据强度的一个衡量标准是贝叶斯因子
pr(e|h)
pr(e)
(已经在§1.2.3中讨论过)。 这是一项直观的证据强度衡量标准。 注意贝叶斯定理
pr(h|e)= bayesfactor(h,e)×pr(h),
因此,如果虽然且才能才能才大于前提概率Pr(h)的高于现有概率Pr(h),但贝叶斯因子大于1。 贝叶斯因子(对于上述值)越大,从后概率之前的向上偏移越大,越强烈地支持H.相反,贝叶斯因子(对于低于1)越小,从后概率之前的向下移越大,越多强烈e负支持H.如果Pr(h)= pr(h恤),证据在H的现有概率上没有影响,向上或向下。
贝叶斯因子是证据E对H支持的绝对衡量标准,因为它在假设H下的概率与一般e的概率相比。 分母在总概率定律之后计算:
pr(e)= pr(e|h)pr(h)+ pr(e|¬h)pr(¬h)。
捕获 - 所有替代假设¬可以通过更细粒度的替代方案所取代,例如H1,H2,...... HK,提供H及其替代方案涵盖整个可能性空间。 然后读取总概率的定律:
pr(e)= pr(e|h)pr(h)+
k
σ
我= 1
pr(e|hi)pr(高)。
代替贝叶斯因素,可以通过可能性比率来评估证据的强度,证据e是否支持假设H'的比较措施,在符号中,
pr(e|h)
pr(e|h')
。
例如,专家可以证明,如果夹克的佩戴者击中受害者(假设H')(假设H')(Aitken,Roberts,&杰克逊2010,38)。 如果证据支持H'超过H',则比率将在一个之上,如果证据支持H'超过H,则该比率将低于一个。 较大的似然比(对于高于1的值),越强的证据与H'对比有利于H'。 较小的似然比(对于低于1)的似然比越小,证据有利于竞争假设H'与H形成对比。
似然比之间的关系
pr(e|h)
pr(e|h')
和后赔率
pr(h|e)
pr(h'|e)
在贝叶斯定理的赔率版本中是显而易见的(见§1.3早些时候)。 如果似然比更大(更低),则后差比率更大(更低),而不是H的前几率。当时的可能性比例是证据对两个假设H和H'的几率的向上或向下影响的量度。
作为证据强度的衡量标准的竞争对手是更简单的概念,概率Pr(E`h)。 认为,当Pr(E`H)低时,E令人难以置疑,E应该是强烈的证据,反对H.考虑Triggs和Buckleton(2014)的一个例子。 在儿童虐待案例中,检察官提供了一对夫妇的儿童岩石(运动模式),只有3%的非虐待儿童摇滚,PR(儿童岩石| NO滥用)=。03。 如果一个不受虐待的孩子不太可能摇滚,这一事实就是这个孩子的岩石可能似乎有强有力的滥用证据。 但这种阅读了3%的数字是错误的。 它很可能是3%的虐待儿童摇滚,公关(儿童岩石座)=。03。 如果在假设下摇摆不太可能 - 这意味着可能比率
Pr(儿童摇滚帽衫)
PR(儿童摇滚|no滥用)
等于一摇摆不能算作滥用的证据。 为了避免夸大证据,最好通过可能性比率来评估它,而是给出了证明的证据的可能性(ENFSI 2015; Royall 1997)。
2.2冷撞击DNA匹配
为了更好地理解可能性比率,将DNA证据视为案例研究是有意义的,特别是在冷击匹配中聚焦。 DNA证据可用于证实案件中的其他证据或作为主要有罪的证据。 假设不同的调查引线指向个人,标记史密斯作为肇事者。 假设调查人员还在犯罪者留下的犯罪现场发现了几个痕迹,实验室分析表明与痕迹相关的遗传型材与史密斯相匹配。 在这种情况下,DNA匹配使其他对史密斯的其他证据进行证实。 相比之下,假设没有调查领先允许警方识别嫌疑人。 唯一的证据包括在犯罪现场发现的痕迹。 警方通过数据库运行与迹线相关联的遗传档案,并找到一个匹配,所谓的冷击。 由于在寒冷的案例中,没有其他证据,冷击匹配是对被告的主要证据项目。 有些学者认为这种情况削弱了比赛的证据价值。 其他人不同意。 我们现在在这场辩论中审查一些主要论点。
2.2.1随机匹配v。数据库匹配
假设专家证明了犯罪痕迹遗传地匹配被告,随机匹配概率极低,比如1占1亿。 随机匹配概率 - 通常被解释为不是源的人的概率会恰到好匹配,Pr(m |) - 是DNA匹配强度的常见量度。 这种概率越低,匹配越强烈的争夺。 严格来说,一个比赛是强有力的证据表明,只有当可能性比率时,被告是源
PR(DNA匹配|)
Pr(DNA匹配|)
明显大于一个。 然而,在实践中,当随机匹配概率低 - 即,Pr(m |)是低 - 似然比应该显着高于一个,因为源是源的概率会匹配,应该高,只要测试具有低电平假负率。 出于实际目的,低随机匹配概率确实计数为强烈的有罪证据。
然而,涉及冷匹配的比赛,出现了进一步的并发症。 Puckett案例可以作为图示。 2008年,约翰·帕克特通过数据库搜索了338,000个人资料。 他是唯一一个与1972年强奸受害者收集的数据库中唯一的人。专家证人作证说,Puckett的遗传概况应在白人男性中随机发生,频率为1,占110万元。 这似乎有强有力的证据对阵Puckett的纯真。 但是DNA专家为辩护,Bicka Barlow指出,除了冷击匹配之外,对Puckett的证据是苗条的。 Barlow认为,通过数据库的大小乘以1/110万所需的冷击匹配的正确评估。 调用此乘法的结果数据库匹配概率。 将1/110万乘以338,000产生的数据库匹配概率大约为1/3,一个不压抑的数字。 如果数据库中的某人可以与1/3的概率相匹配,则冷击匹配不应计入对Puckett的有力证据。 这是巴洛的论点。
巴洛遵循国家研究委员会的1996年报告,通常被称为NRC II(1996年国家研究理事会)。 该报告建议在冷击案中,随机匹配概率应乘以数据库的大小。 这种纠正意味着防范数据库中无辜人员错误的误差风险。 NRC II使用类比。 如果您立即抛出几种不同的硬币,并在第一次尝试时显示头部,这一结果似乎有强有力的证据表明硬币偏置。 但是,如果您可以获得多次重复此实验,几乎可以肯定,在某些时候,所有硬币都将落地头。 这一结果不应计入硬币偏置的证据。 根据NRC II,重复硬币折腾实验多次类似于尝试通过搜索配置文件数据库来找到匹配。 随着数据库的大小增加,更有可能与犯罪无关的数据库中的人会匹配。
比喻的适应性受到挑战(Donnelly和Friedman 1999)。 搜索较大的数据库毫无疑问,在某些时候增加找到匹配的可能性。 但这里的相关命题不是“数据库中的至少一个配置文件将随机匹配犯罪样本”。 相反,相关命题是“审判的被告的个人资料将随机匹配犯罪样本”。 找到被告和犯罪样本之间的匹配的可能性不会增加,因为数据库中的其他人进行了测试。 事实上,假设世界上的每个人都在数据库中录制。 独特的冷击比赛将是极强的内疚证据,因为除了一个匹配的个人之外,每个人都将被排除为嫌疑人。 相反,如果随机匹配概率乘以数据库的大小,则匹配的求验值应该非常低。 这是反直观的。
另一个类比有时用于争论冷击匹配的证据价值应该削弱。 类比在搜索数据库中的匹配和多个假设测试之间,令人反感的研究实践。 在经典假设检测中,如果在假设的单个测试中I型错误的概率是.05,这种概率将通过多次测试相同的假设来增加。 数据库匹配概率 - 参数转到 - 对于I错误的风险增加,可以正确。 然而,由于Balding(2002,2005)指出,多次测试包括多次对新证据进行测试相同的假设。 在寒冷的情况下,多个假设 - 每个关于数据库中的不同个体 - 仅测试一次,然后在发生负匹配时排除。 从这个角度来看,被告是源的假设是待测试的许多假设之一。 冷击匹配支持该假设和规定其他假设。