动物福利评估方法
摘要:我们的许多决策需要关于动物福利、伦理、管理和政策的准确信息。 不幸的是,目前用于估计动物福利的许多方法都是主观的和不可靠的,因此可能不太准确。应用科学的动物福利原则方法来获得更准确的分数将帮助我们对动物做出最佳决策。构建并应用了福利措施需求框架以评估目前可用的最佳方法,结合整体动物措施和组合测量框架来评估福利将为我们提供最准确的答案以指导我们的行动。
简介:在很多情况下动物福利都很重要。 在道德上大多数人都同意动物福利很重要:动物受苦是不好的,动物过上幸福的生活是好的,我们应尽可能采取行动防止前者,让后者成为可能。动物福利可以被理解为不同的事物——就像人类福祉一样。对动物福利持主观或享乐主义观点,其中福利在于动物经历的主观心理状态,包括正面或负面、强度和持续时间”。选择这个概念有两个主要原因,我将在这里简要总结一下。主观体验在道德上具有重要意义——在决定如何对待其他动物时,几乎普遍将动物受苦作为道德相关特征。 第二个是主观经验与生物学相关,从动物本身的角度看待福利以及什么符合它的利益,它喜欢什么、想要什么和需要什么。动物的积极和消极体验——快乐和痛苦——仍然是动物福利的一部分。旨在减少动物痛苦和/或增加快乐的任何决定,这项工作将是相关的。我们的许多决策需要不同条件下动物福利的准确信息以便评估和比较不同可能行动的成本和收益。当试图决定哪一种是用于量化动物福利以进行政治和道德决策的最佳措施时,我们需要考虑这一措施必须具备哪些特征才能使其适合这一目的。我将开发一个评估潜在措施的框架,将标准分为三类——正确性、有用性和可行性。虽然其中一些是几乎所有措施质量的一般标准,但其他一些更具体到主观动物福利和所讨论的决策背景。我将在接下来的部分中继续研究衡量福利的不同方法如何满足这些标准。
正确性标准:第一组标准是正确性标准,它代表了该措施将在多大程度上给出正确结果—即真正反映动物福利的数字。这些是最关键的标准,因为没有正确的输入,产生的任何结果都将毫无意义。
有效性:有效性可能是最重要的。如果测量的是预期目标,而不是某些其他属性或状态,则测量有效。这一点之所以重要,是因为如果一项措施无效——如果它不是在衡量动物福利——那么它是否符合其他标准也并不重要。重要的是要非常清楚目标状态-构成福利的一组完整的心理状态以确保该措施正在跟踪这一点并且仅跟踪这一点。虽然不同的福利概念可能包括福利的其他组成部分,但这些并不是本项目的目标。在道德上仅仅将我们认为重要的动物福利有关的事情进行广泛的分类是不够的。否则,一项措施可能会产生误导性结果,并导致提出对动物无益的行动建议。采用预先定义的福利概念,然后评估与此相关的有效性是确保我们达到预期目标的更好方法。通过测量变化和目标状态变化之间存在的可靠相关性来测试有效性,特别是在实验操作下,因为这有助于排除会破坏有效性的非因果相关性。对于主观动物福利,无法直接测量目标状态,仍然可以通过与其他已确定的测量值进行关联,或通过对上游变量进行操纵来改变下游变量以建立因果关系来实现。因此,可以评估措施以及如何执行此验证过程。
准确性:除了测量预期目标有效性外,还应测量准确性。这意味着测量值接近目标系统中的实际值——即当主观福利较高时,测量值较高,中、低等的测量值类似。还包括检测福利相关变化的灵敏度:即,当动物的福利体验有小幅度增加或减少时,测量值将相应变化。特别是在比较非常相似的系统或研究不同干预措施对系统的影响的情况下,虽然个体变化可能非常小,但如果大量动物受到影响,总影响可能仍然很大。未能跟踪此类变化的不敏感措施将无法提供正确的建议。测量可能是有效的,并且测量了正确的目标,但仍然不准确。例如,考虑根据一个人对环境温度有多热或多冷的主观“感觉”来估计环境温度。根据感觉的温暖程度,可能会猜测室外温度在 20 多度左右。这是一个有效的措施,因为响应的是环境温度而不是其他状态。 但是,它测量精度很低,因为可能仅在 ± 5°C 左右的范围内才正确。也可能有一个准确但无效的方法,因为它不是测量预期目标,而是测量其他目标-可能是导致目标变量和方法发生变化的共同原因。
完整性:用于所描述的决策环境的动物福利测量必须完整,提供对动物主观福利整体状态的全面评估。仅代表动物体验的某些部分而忽略或忽略某些方面的措施将无法达到此目的。衡量标准应该包含构成主观福利体验的不同影响,或所有促成它的条件。例如,一些措施可能只反映身体健康,而不考虑福利的心理因素,但这些措施将无法提供准确的分数,从而导致错误的建议。从某种意义上说,这是准确性的一部分,因为不完整的措施会给出不准确的结果,但由于福利措施的完整性程度不同,因此值得关注和独立评估。
可靠性:最终的正确性标准是可靠性,这意味着测量方法在重复时应该给出一致的结果,重复测量之间的差异很小。从这个意义上讲,重复可以有多种类型,理想情况下,我们的测量应该在所有类型中都是可靠的,包括观察者内(同一观察者采取的多次重复测量)、观察者间(不同观察者对同一目标采取的测量)和重复测量。在可靠性低的情况下,这会降低任何特定测试产生的结果准确的可能性,甚至降低测试有效的可能性。
有用性标准:上面描述的正确性标准对于选择正确的措施是最重要的,因为它们确保生成的结果是正确的。有一系列不同的情况需要量化动物福利投入来帮助决策。 理想情况下,一个措施应该在所有感兴趣的上下游都有用。这意味着对所有被调查的物种使用相同的衡量标准,因为对不同物种使用不同的衡量标准可能会削弱比较。这些决定将涵盖大量的动物物种——从大型哺乳动物到现在用于农业系统的昆虫和虾——并且该措施应适用于所有这些物种。这仍然没有解决如何标准化分数以进行种间比较的问题——没有任何衡量标准能够既为一个物种提供福利得分,又表明如何适当地衡量——但如前所述,这是一个更复杂的问题,需要独立处理。它还应该适用于从牲畜到野生动物的不同类型的动物使用,以增加决策范围。对于所讨论的大多数目的,例如政策分析和比较痛苦估计,重要的是要有一个基本量表。也就是说,量表是在一个基本测量范围(间隔或比率)上进行的,而不是仅仅比较序数量表。虽然对于其他应用程序而言,比较序数排名可能就足够,甚至是首选,但出于本文所述的目的,计算需要基数数据。我曾在其他地方论证过,主观福利可以在这些类型的量表上测量,但重要的是我们选择一种测量方法,有意义地测量。该方法还应该是双向的,能够代表两个方向(正面和负面)的福利状态。一些措施特别关注痛苦,没有考虑积极的福利体验,这会扭曲结果。 一项无法涵盖积极和消极福利体验的衡量标准将无法捕捉我们关心的一切。这并不意味着零点两侧的总可能强度必须相同——例如,最糟糕的痛苦状态可能比最好的快乐状态更糟糕,Norowitz使用了+10到-25的量表。
信息性:我们的措施最好是信息性的,提供关于影响动物主观福利的特定饲养环境和畜牧条件的信息。这样就可以将测量结果用于指导改善这些动物福利的行动。 只有通过了解哪些条件是不良(或良好)福利的主要原因,才能决定改变什么。还有可行性的考虑。 我们希望我们的测量是正确和有用的,以便它们为我们提供准确的结果,我们可以在需要的地方应用它们。 这两组标准都描述了措施的使用及其适用性。可行性标准指的是测量过程,以及在各种感兴趣的情况下收集和应用测量的容易程度。可行性标准指的是测量过程,以及在各种感兴趣的情况下收集和应用测量的容易程度。这些标准不如前两组重要; 在可能的情况下拥有它们会很好,但不是必需的。仍然可以提供一些理由来选择某些措施而不是其他措施,特别是在使用的实际环境中具有各种约束和限制。易用性是指收集和应用该方法的容易程度。所有这些措施都需要在现实世界中采取和应用,并受到时间、金钱、接触动物等方面的限制。这意味着最好有一个易于收集的措施,最好是一个不需要大量时间或金钱的简单程序。特别是大规模测量动物或大范围的机构,耗时或复杂的测量和计算可能不适用。评估和比较不同机构和饲养环境类型的动物典型生活质量的情况下可能需要测试代表性样本并从中推断。目前或近期使用的措施的一个限制是相关数据的当前可用性。讨论的许多措施都是非常新的,许多物种的数据尚不可用。在需要迅速开始进行比较以便立即采取行动的情况下,最好选择已经收集了大量数据的措施而不是仍然要求评估人员进入现场进行相关测量的措施。描述了一个评估不同福利措施的框架,考虑到正确性、有用性和可行性,提出了一系列满足标准的措施。下一步是研究不同类型的不同措施以评估它们在多大程度上符合这些标准。不会试图根据想要结果对方法进行定量评估。可以尝试根据每个指标满足每个要求的程度对其进行评分,并使用所得结果来选择“获胜方法”。分数的分配具有很大程度的主观性,它们之间的权重也非常随意;只有采用有原则和可靠的方式分配分数和设置权重,这种方法才是合适的。相反,我使用定性方法来考虑措施是否符合标准。没有给出明确的分数,也没有为不同的标准应用特定的权重,尽管一些标准比其他标准具有更高的优先级。这意味着对不同的方法没有明确的评级,哪一个最适合任务将取决于应用程序中的上下文因素。该方法允许讨论它们的每一个优点和缺点,以及“理想”测量方法应该具备哪些特征。 下面我将研究一系列不同的福利措施并讨论用于衡量主观动物福利的标准相关的表现。测量分为两类——全动物测量和组合测量。整体动物测量是应用于单个动物的单个指标,用于表示动物至少在采取测量时所经历的整体生活质量。它们能在多大程度上代表长期累积福利经验尚不确定。这些措施基于这样一种假设,即动物能够在内部“计算”不同积极和消极情感状态之间的平衡。这一假设的合理性主要取决于这些影响在指导权衡和行动决策方面的进化作用,在这里我将假设这些措施是有效的。组合措施更复杂,结合多条证据,适当加权以给出单一的生活质量评分。 这些证据都是部分测量:反映某些特定福利贡献者的指标,例如特定的影响或环境条件。例如,身体状况评分通常被用作饥饿或营养状况的指标。虽然这些部分措施本身无法完成此处所需的任务,因为它们都是不完整的,但在描述的某些框架中组合使用时它们会很有用。如果组内动物的个体经历存在很大差异,这可能会降低准确性。
整体动物测量:评估的第一组措施是对整体动物的措施。 这些措施由单个指标组成以代表动物的总体生活质量。整体动物测量值是有价值的,因为它们可以给出一个完整的分数,代表动物的整体主观福利状态; 它们通常快速且易于应用。主要缺点是,在大多数情况下无法提供哪些条件负责对动物生活福利好或坏的信息,因此本身不能作为干预指南。本节将讨论最常用的整体动物测量——人类直觉估计、定性行为评估 (QBA) 和认知偏差——根据需求评估它们的适当性。
人类直觉估计:人类直觉估计是有效利他主义组织使用的计算器中填写动物痛苦估计的常用方法。该方法涉及一名或多名人类观察员,他们汇编有关动物生活和饲养条件的信息,并在此基础上对该系统内动物的痛苦程度或生活质量做出判断。该措施的时间范围将在很大程度上取决于估计者使用的信息。这种方法的好处——以及迄今为止使用它的原因——在于有用性和可行性。这些方法相对快速且易于应用,可以在一系列物种和环境中使用,可以在用户选择的任何类型的量表上使用。这些方法的主要问题是评估的主观性,完全基于观察者的直觉判断。主观性极大地破坏了测量的正确性。它可能是无效的,因为所测量的不是真正的动物生活质量,而是观察者对特定类型的饲养环境情况和动物生活类型的偏好。不同观察者及其得分之间存在很大的差异,这意味着很可能不准确。该措施可能完整,也可能不完整,取决于观察者在纳入可能影响福利的动物生活的所有方面做得如何。可以通过 Delphi 方法和足够多样化的专家小组来评估这些方法以达成共识,但需要评估可靠性和有效性。
定性行为评估 (QBA):定性行为评估(QBA)是一种更严格、更具前景的人类直觉评估。经验丰富的观察者使用QBA通过直接观察,使用动物的行为和肢体语言,以及它与环境互动的方式对动物的主观福利做出判断。它是一种“综合福利评估工具”,观察者整合了来自动物的行为和肢体语言的许多信息以对其整体情绪进行判断。它主要是一种短期测量,代表了最近对动物福利的影响,因此最适合用于特定即时变化的影响评估。这种方法的主要好处是可行的。它允许简单快速地评估动物的健康状况,而无需收集大量详细数据。给出了双向基本输出,确定了总体福利为正和负。QBA在正确性标准上得分也很高。对动物的整个福利状况进行了全面评估。已与其他生理和行为福利指标进行了验证并显示出高可靠性和准确性。主要的潜在缺点是适用范围。 到目前为止它主要用于大型哺乳动物,并且由于它依赖于人类对行为和肢体语言的估计,因此对不同或我们不太熟悉的物种(例如鱼类和昆虫)可能没有多大用处。这种方法具有“人类直觉估计”方法的大部分优点,而没有与缺乏准确性或有效性相关的缺点。它的使用范围可能有限,这取决于它对更广泛物种的有效性验证——如果验证成功,它可能是快速评估整体福利体验的一种强有力的可行方法。
认知偏差:最后一种整体动物测量是认知偏差测试。 这些通过对认知过程的影响来衡量动物的整体“情绪”。认知偏差的主要测试是判断偏差,它通过确定动物的“乐观”或“悲观”程度来反映其情绪或福利。经历过主要积极状态的人更有可能乐观地看待模棱两可的信号,而经历过主要消极状态的人则更有可能悲观地看待模棱两可的信号。与 QBA 一样,认知偏差是一种更直接的福利措施,应该相应地应用。从迄今为止的测试来看,认知偏差测量似乎在正确性标准上得分很高。通过对人类认知偏差的类似研究,以及在环境和药理学的实验操作下产生预测结果,认知偏差方法已经得到了验证,尽管它们还没有经过专门的可靠性测试。其是一个完整的衡量标准,对动物的整体情绪进行评分,整合其全方位的福利体验。在有用性标准上得分也很高。可以根据相对于既定最大值和最小值的判断偏差程度给出基本输出分数,这些分数是双向的,可以识别正面和负面的福利状态。它们应该适用于许多条件和物种——目前涵盖哺乳动物、鸟类、鱼类甚至蜜蜂。认知偏差测试的主要缺点是可行性,特别是所需的高级培训。这不仅耗费时间,降低了测量的可行性,而且还可能降低准确性,因为训练本身可能会改变福利。进一步研究其他类型的认知偏差可能有助于开发更适合的测试,而不需要训练。经历负面影响的动物将表现出对负面刺激的更多关注;体验负面影响的生物将表现出更大的对负面记忆的回忆;当动物处于积极情绪状态时,将表现出较高的奖励预期。由于其准确性和适用范围该方法可能是整体动物测量中最有前途的。需要进一步的工作来确定劳动密集度较低的方法的有效性和准确性。
组合措施:使用多个部分指标创建组合测量,每个部分指标代表主观福利体验的贡献者,如营养、健康或行为。通过对总体体验的相对贡献进行评分和加权以获得总体生活质量分数。可以为我们提供有关不同条件对动物福利影响的详细信息。主要缺点是有可能漏掉一些福利贡献者导致计算不完整,或者可能在模型的不同组成部分之间具有不准确的权重。与人类直觉估计一样,这些措施的时间量表范围将取决于用于构建它们的特定指标的范围。组合测量框架通过将福利划分为不同的类别来运作,例如营养、饲养环境、健康和行为,并从其中确定不同的指标来衡量不同的组成部分。这些模型对个体价值的影响非常敏感。相关类别的选择以及这些类别内指标的选择将反映框架构建者的价值观和承诺。使用的量表类型也有所不同。 五个领域明确使用序数量表 (A-E),以防止在数据不支持的情况下过度精确。所有此类框架的最大弱点在于设置不同成分对主观福利体验的相对影响的权重,这代表了不同框架之间的最大差异。
结论:有很多理由支持量化动物的福利水平,包括政策决策、评估影响和比较不同的干预措施。提出了一系列衡量主观动物福利的理想标准并根据这些标准评估了几种常见的福利措施以确定哪些最符合我们的要求。特别是区分了各有不同的优势和劣势的整个动物和组合措施。最好的选择是同时使用组合测量和整体动物测量,因为它们具有互补的优势和劣势。整体动物测量是完整的,具有更高的有效性和准确性,而组合测量通常更易于应用,并提供更多关于福利伤害和福利来源的信息。将两者结合起来可以让我们了解动物的整体情绪/福利,同时让我们能够确定需要改变的地方。Aerts 等人提出了类似的观点。 主张结合使用饲养条件评估、饲养员评估和动物评估的措施来全面了解动物福利。结合使用还使我们能够相互验证措施,以确保我们没有遗漏任何一方。缺乏一致性可能有助于指出综合措施在哪些方面遗漏了福利的某些组成部分。组合测量的最大弱点是为模型的不同组件设置权重时涉及的主观性。如果没有正确设置权重的方法以便从动物的角度反映不同经历对福利的实际影响则模型的输出可能完全错误。使用整体动物测量值可以使我们采用客观的方法来确定组合测量不同因素权重。目前主观动物福利的最佳整体动物测量可能是认知偏差,但需要做更多的工作来确保其有效性和准确性。最佳组合措施是DSS框架,其一个版本具有改进的输入,并系统地使用整体动物测量或偏好测试来设置如上所述的因素权重,将是创建完整福利测量的最佳方式。使用如上所述的测量方法将使我们能够量化不同条件下的主观动物福利。准确衡量动物福利是做出包括动物利益在内的决策过程的关键部分。通过福利测量获得所需的信息能帮助我们做出减少痛苦和改善动物生活的知情决定。
- 没有相关内容!
编辑信箱
欢迎您推荐或发布各类关于实验动物行业资讯、研究进展、前沿技术、学术热点、产品宣传与产业资源推广、产业分析内容以及相关评论、专题、采访、约稿等。
我要分享 >热点资讯
- 年
- 月
- 周