
幕后文章是与国家科学基金会合作提供给生活方面的。
要爱小熊。多亏了他们,美国最高法院录音的数据库现已向公众免费提供。太多了吗?并非如此,因为该工具是从一个人对芝加哥幼崽,技术和法律研究的热爱而生的。
20年前,在箭牌球场的一个阳光明媚的下午,当时的西北大学政治学教授杰里·高曼(Jerry Goldman)坐在看台上,与几个学生一起享受一场比赛。他们考虑了棒球是美国最高法院的隐喻:九名球员,九名法官。一场比赛打开了伟大的球场和惊人的接球。另一个关于口头辩论和周到的裁决。
高盛(Goldman)认为,如果棒球卡解释了有关球员职业生涯的重要细节,为什么不为大法官创建卡片并添加视频和音频呢?考虑到这个项目似乎是可以实现的超卡,用于早期Apple计算机的应用程序和编程工具。 “我的同事们认为我(从事这些技术项目)很疯狂,”伊利诺伊理工学院(IIT)芝加哥 - 肯特法学院的教授高盛说。 “但是我认为信息技术将改变世界的运作方式。”
高盛的“真正使最高法院人性化”的追求导致了NSF资助的发展Oyez项目,一个多媒体档案馆,其中包括法院自1955年以来听到的可搜索的口头论点。iscotus现在也可用。
高盛说:“主要目标是将法院从崇高的身份中降低,并将其带给公众。” “我们还想提供与法院相关的大量数据。”
创建可搜索的音频和视频
为了使最高法院栩栩如生,高盛首先说服了存储法院档案的国家档案馆,以允许他复制磁带进行转录和数字化。为了使新数字化的录音带可搜索,高盛与马克·利伯曼,宾夕法尼亚大学的计算语言学教授。 Liberman改编了一种算法,该算法可以在录音带上的声音与书面成绩单相匹配。这项工作最终导致了Penn强迫对准器,现在通常用来将口语与书面文本相结合的工具。
“我们从本质上制作了一个类似Google的搜索引擎,以获取音频和视频录制,”由于档案馆对学者和公众的价值而被吸引了这项任务。他还欢迎有机会创建一种适用于众多来源可提供的音频和视频录制收藏集的搜索技术。
Liberman说:“ [W]能够建立一个模型,以如何以具有成本效益的方式进行搜索。这似乎是一个大型项目,但与现在在线可用以及将来的产品相比,它很小。”
(最近,牛津大学和大英图书馆的利比曼同事使用对齐工具来破译录音英国国家语料库,一个档案,上面有一段1亿个单词的口语,从参与者那里收集了他们的演讲,他们在索尼步道上录制了演讲。
分析数据
接下来,高盛分析了最高法院的近14,000个小时的口头辩论音频。他说:“关于数据集有无数问题。” “但是,这是一个不寻常的数据集,因为它具有多个扬声器,并且是自发的。”第一个任务之一是在每个口头论点中确定每个说话者 - 这是一个挑战,因为大约有11位发言人可能参与了一个论点。此外,多年来,成绩单没有用正义的名字标记问题。
在承担这些挑战时,高盛和他的合作者 - 包括卡内基·梅隆大学和明尼苏达大学的同事 - 自1955年以来就汇编了许多有关法院运作的有趣事实:
- 32个大法官超过58年
- 8,600名倡导者,其中70%仅出现在法庭上一次
- 说6600万个单词
- 超过6,100个案件和2300多个意见公告
- 最长的论点 - 1300分钟
- 最短的论点 - 14分钟
在法庭上服役27年的安东尼·斯卡利亚(Antonin Scalia)大法官在大多数健谈的情况下保持了记录,其中7,200分钟,而服务23。5年的费利克斯·法兰克福特(Felix Frankfurter)在7,000分钟的比赛中排名23。5年。最受限制的法官是谢尔曼·明顿(Sherman Minton)和克拉伦斯·托马斯(Clarence Thomas)。尽管明顿在法庭上任职七年,但他的去年只有记录在案。在他的最后一学期中,他只听了17分钟。自1991年以来,托马斯(Thomas)在法庭上的时间为23分钟。
尽管Oyez项目为法律学者提供了很多材料,但语言学研究人员也分析了各种研究的录音。
将法院带到人民
为了确保公众和学者可以轻松探究数据,高盛的团队继续进行改进并开发界面。在2013年秋天,搜索功能将添加到数据系统中,以帮助用户更深入地深入研究材料。例如,这种新的搜索功能将使用户能够在成绩单中查看术语“严格审查”一词,听取它,然后做听众想对其进行的任何操作”。
芝加哥人喜欢说:“不需要一些计划。”高盛是忠实于这个声明的。他想将最高法院项目中开发的工具应用于美国所有上诉法院。该计划是开发网站和移动设备应用程序。最近,骑士基金会授予了Oyez项目的60万美元,为加利福尼亚州,佛罗里达州,伊利诺伊州,纽约和德克萨斯州的州最高法院开展这项工作。
“这些应用是最酷的部分,”高盛说。他们将遵循iscotus的设计现在,这是高盛和卡罗琳·夏皮罗(Caroline Shapiro),也是IIT芝加哥 - 肯特法学院的教授。 iscotus现在提供当前最高法院案例上所有内容的访问权限,并包括音频和成绩单。通过简单的动作,用户可以翻阅成绩单,搜索并与同事共享部分。 “最好的部分?”高盛说。 “所有这些信息都是免费的。”
Oyez项目的规模是高盛从未想象过的一个。他说:“没有NSF的支持,我们仍然会挣扎。” “ NSF的支持使我有勇气不思考任何一些想法。”
编者注:幕后描绘的研究人员已得到文章的支持国家科学基金会,联邦机构负责在科学和工程领域的所有领域资助基础研究和教育。本材料中表达的任何观点,发现和结论或建议都是作者的意见,不一定反映了国家科学基金会的观点。看到幕后档案。