目錄
一、基于裁判文書法學實證研究發展狀況檢視
二、基于裁判文書法學實證研究演變内因剖析
三、基于裁判文書法學實證研究推進路徑的思考
摘 要:知識圖譜分析結果表明,基于裁判文書的法學實證研究成果數量總體上呈現增長趨勢,但在近兩年出現明顯下降;基于裁判文書法學實證研究學術群體規模正在逐步緩慢擴大,但研究成果在研究主體間的分布呈較為集中趨勢;研究成果所涉及學科領域具有較為明顯的局限性,且具體研究内容伴随熱點問題獲得短暫爆發之後開始呈退縮之勢。在方法轉型背景之下,基于裁判文書法學實證研究的演變,受到研究方法在數據可得性、數據完整性以及數據客觀性等方面所存在之優勢與缺陷影響。研究人員自身應當在研究過程中通過豐富研究數據、規範研究方法之适用以及推動數據處理技術的發展等方式尋求基于裁判文書法學實證研究的長遠發展之道。
關鍵詞:知識圖譜; 裁判文書;實證研究;内容分析法;數據處理
本文載《現代法學》2020年第3期
近年來,随着我國裁判文書公開制度的不斷完善,以裁判文書法律大數據作為分析對象的法學實證研究越來越受到學者的青睐。然而,無論是基于裁判文書實證研究所對應的研究方法,還是作 為具體數據來源的裁判文書本身,都存在可能阻礙法學實證研究整體發展的固有缺陷。因此,我國法學實證研究是否真如學界所期許的那樣,借助裁判文書可得性的提升,實現其自身的迅猛全面發展,還需要予以全面審視。長期以來,關于法學實證研究之審視的理論研究成果并不缺乏,遑論研究者對實證研究是秉持支持還是反對态度,但這些研究成果中,一則缺少将基于裁判文書法學實證研究作為獨立研究對象的審視,二則對于法學實證研究實然狀态的評判缺乏客觀數據的支持。因此,為明确裁判文書在法學實證研究中的具體應用,本文以citespace軟件為工具,拟以從中國知網 檢索得到的612篇以裁判文書為數據來源的實證研究期刊文獻為分析對象,對我國基于裁判文書法學實證研究中的研究成果産出、研究參與者以及研究視域等三個主要方面進行實證考察,進而在剖析其演變内因的基礎上對如何利用裁判文書進行實證研究的科學徑路陳一孔之見。
一、基于裁判文書法學實證研究發展狀況檢視
(一)研究成果産出
裁判文書作為司法過程的主要産物,其中承載着可為法學實證研究所用的豐富數據信息,其網絡公開數量在近年來的迅猛增長,則被諸多法學實證研究學者視為本領域發展的重要契機。而理論研究成果作為學科發展的主要表征之一,也必然随着裁判文書網絡公開數量的增長而增多。申言之,基于裁判文書法學實證研究作為以裁判文書為基礎數據來源的具體研究形式,其所産出之研 究成果數量,除受法學研究方法轉型之影響外,還應與裁判文書網絡公開數量在一定程度上呈現出正相關關系。
通過對中國知網中檢索所得的期刊文獻按年度進行統計,結果如圖1所示。根據發文量的年度分布數據所構建的線性方程系數為正,R方值為0.7539。這一結果表明,基于裁判文書法學實證 研究成果的數量與時間序列成正相關,就總體趨勢而言,随着時間的推進,基于裁判文書的實證研究成果數量也随之增長。然而,如若對發文量在具體年份的分布情況進行觀測,在總體增長趨勢之下,基于裁判文書法學實證研究成果數量變化仍可以劃分出較為明顯的三個階段:第一階段為2000 年至2011年,該階段中,研究成果數量呈緩慢增長趨勢,年度發文量較少,且年度增長率較低;第二階段為2012年至2017年,與第一階段末的2011年發文量相比,本階段初2012年的發文量得到明顯提升,并且,本階段中的2013至2016年之間的發文量以較高的年度增長率明顯高于第一階段;第三階段,即2019年,本年度發文量與第二階段末的2018年發文量相比急劇下降。
期刊文獻年度發文數量在前兩個不同階段的界限劃分,即2011年至2012年間發文量的明顯增長,與該階段我國裁判文書網絡公開數量的發展變化存在高度契合。然而,單就發文數量而言,第三階段的研究成果數量急劇下降,與之前較長時期内的研究成果總體增長趨勢明顯相悖,進而表明該階段研究成果數量變化與我國裁判文書網絡公開裁判文書總量不斷增長趨勢明顯不相符合。據此,綜合比較各階段研究成果數量的變化趨勢,可以得知,基于裁判文書法學實證研究的發展确實與裁判文書網絡公開數量增長之間存在較為明顯的相關性,但該相關性本身可能受到其他因素的反向影響與調節。

(二)研究參與主體
基于本文所選取的期刊文獻樣本,通過使用citespace軟件對文獻中所涉及研究機構進行分析, 首先得到研究機構的總體分析情況。如圖2所示,西南政法大學、中國政法大學、山東大學2003网站太阳集团、吉林大學2003网站太阳集团、四川大學2003网站太阳集团、北京大學2003网站太阳集团、浙江大學光華2003网站太阳集团、中國人民法學2003网站太阳集团、中南财經政法大學2003网站太阳集团以及上海交通大學2003网站太阳集团等機構研究成果突出,其他研究機構所産出的成果數量則十分有限。即從總體上來看,雖然已有一定數量的研究機構開展基于裁判文書法學實證研究,但研究成果的産出則集中來自于以“五院四系”為典型的少數法學研究機構。對比當前我國2003网站太阳集团系及專門科研機構總體數量,可以得知,基于裁判文書開展法學實證研究的學術群體規模依然較小。

與此同時,圖中所展示的研究機構共現關系也表明,到目前為止,從事實證研究的科研機構之間的相互合作甚少。對于法學實證研究而言,在大數據與人工智能理論與技術不斷發展的背景之下,由關起門來做研究向合作共享的轉變應是其實現迅猛發展并真正實現自身價值的正确趨向。而圖中所揭示的“單兵作戰”為主的法學實證研究現狀,也在一定程度上進一步證實,實證研究方法 在法學領域的應用尚處于初級階段,研究人員對于法學實證研究發展趨向尚未形成準确而深刻的認識。
如圖3所示,不同于研究成果數量的分布,開展基于裁判文書法學實證研究的機構并未随着裁 判文書可得性的提升而出現急劇增長,而是在基于裁判文書法學實證研究興起後較長一段時間内學術群體規模成緩慢增長之勢。

具體而言,基于裁判文書法學實證研究的學術群體規模變化,同樣可以分為較為明顯的三個階段。在第一階段,參與研究之主體主要為西南政法大學、中南财經政法大學以及山東大學等總體分布結果所顯示的本領域主要研究機構。結合總體分布結果可以得知,該部分研究機構不僅在本領域研究成果豐富,其開展本領域研究的時間跨度同樣長于其他研究機構。該階段中雖然也存在較少數量的其他研究機構,如廣東警官學院、四川師範大學等,但從其所對應的節點大小來判斷,該部分研究機構總體研究成果極少,說明該部分研究機構并沒有持續在本領域開展研究。在第二階段, 新增研究機構數量總體較少,但在此階段中所新增的研究機構,如吉林大學、中國人民大學以及華 東政法大學等,都在總體上産出了豐富的研究成果,其他新增機構則在本領域的研究成果有限,從而未體現出研究的持續性。而在第三階段中,即最近幾年以來,新增研究機構數量較第二階段明顯增多。本階段中,已有部分研究機構,如2003网站太阳集团、江西财經大學、雲南大學等,以較其他新增機構在研究成果數量方面顯現出一定的優勢。
相比于研究成果數量,學術群體的規模發展能更為準确地揭示法學研究者對于實證研究方法的認可與接納狀況。綜合基于裁判文書法學實證研究機構數量增長的三個階段來看,與研究成果 數量随着裁判文書可得性增強而得到明顯提升不同,本領域學術群體的擴展經曆了一個較為漫長的過程。并且,結合研究機構總體分布所呈現出的集中趨勢,可以證實,裁判文書網絡公開數量的增長主要促成了原有研究機構的成果産出數量,而非其他研究機構對于實證研究方法的認可接納, 進而嘗試方法轉型。申言之,不同于研究成果數量在特定階段與裁判文書網絡公開數量之間明顯相關,實證分析方法在法學領域的傳播與發展表現得更加獨立且緩慢。
(三)研究領域
在通過citespace軟件所得出的關鍵詞共現關系的基礎上,進一步進行關鍵詞聚類分析,聚類 結果顯示Q值為0.6556且S值為0.5119,說明分析結果中的結構劃分是顯著的、聚類結果具有可靠性。如圖4所示,依據所占比重大小,聚類分析共得到實證研究、量刑建議、法定賠償、法治、司法改革以及司法鑒定在内的6個主要類别。單從類别名稱來看,以學科劃分為标準,基于裁判文書法學實證研究成果中涉及最廣泛的“量刑建議”相關内容應屬刑事訴訟領域,而廣泛程度緊随其後 的“法定賠償”相關内容則屬于知識産權領域。關于其他類别,法治、司法改革以及司法鑒定屬于全 局性或者說普遍性關鍵詞,則需要通過分析本類别中的關鍵詞共現關系,在明确本類研究成果論證 基點的基礎上,來明确其所在研究成果涉及之具體研究領域。故此,為明确各類别研究成果所歸屬的具體學科領域,我們繼續結合各類别中所包含的主要關鍵詞進行探讨。

如表一所示,綜合聚類分析結果及對各類别中所包含主要關鍵詞的解讀,可以得知,基于裁判 文書的實證研究成果中涉及最廣泛的問題是刑事訴訟領域中的量刑問題,其次是知識産權侵權賠 償與法治問題,最後是司法體制改革及環境糾紛等階段性熱點問題。而且,對于法治問題以及司法改革問題的研究也主要基于刑事訴訟程序來展開,對于知識産權的研究中同樣涉及刑事訴訟方面 的具體問題,因此,完全可以确定,我國基于裁判文書法學實證研究所涉學科領域之中心在于刑事訴訟,對于其他領域的研究則極其缺乏。換言之,從總體分布上來看當前我國基于裁判文書法學實證研究之視域難謂寬闊。當然,我國法學實證研究尚處于發展進程中較為初級的階段,研究者視域 需要随着本領域的發展而不斷開拓。

為進一步明确基于裁判文書法學實證研究所涉及的具體研究内容之發展,本文通過citespace 軟件得出關鍵詞時區分布圖。如圖5 所示,自基于裁判文書法學實證研究成果得到顯著增長以 來,研究成果中所出現關鍵詞的時區分布同樣呈現出較為明确的三個階段。2011年至2015年之間,研究成果中所出現關鍵詞的總量與年度增量均不大,甚至可以稱之為匮乏。并且,本階段所出現的為數不多的關鍵詞中,半數以上均可明确被歸類于刑事訴訟領域,如量刑程序、量刑、量刑建議等。2016年與2017年,關鍵詞數量急劇增長,呈爆發狀态。關鍵詞類型同樣得到一定程度的豐富, 知識産權、證券等領域歸屬明确的關鍵詞出現,也說明基于裁判文書法學實證研究所涉及之領域得到拓展。由于在第一階段末期,即司法改革的總體規劃和具體方案陸續出台之際,司法改革作為 研究成果關鍵詞出現,且其與第二階段關鍵詞存在密切的共現關系,即可認為,第二階段研究關鍵詞數量急劇增長在一定程度上得益于當前研究熱點與基于裁判文書法學實證研究的密切關聯性。當然,與前一發展階段一緻,在本階段之中,刑事訴訟領域關鍵詞仍然大量存在,如刑事司法、死刑以及受賄罪等。2018年至今,關鍵詞數量急轉直下,且呈逐年下降之勢。由于2018年所出現之關 鍵詞主要與司法改革相關,如庭審實質化、以審判為中心等,且該相關性在2019年随之減弱,即可認 為,該階段關鍵詞數量下降同樣可在一定程度上歸結于司法改革作為研究熱點的消退。同時,這也可以在一定程度上對近年來參與本領域研究的研究機構數量增多而研究成果數量反而下降之現象 予以解釋。即随着研究熱點消退,研究者們的個體産量逐漸下降,即便有新的研究機構加入,也無法阻止研究成果總量的下降。
根據對關鍵詞時區分布的分析,可以得知,基于裁判文書法學實證研究所涉之學科領域在較長 的發展進程中确實在一段時間内得到明顯拓展,然而,由于該拓展本身具有一定的偶然性,學科領 域的拓展進程随着機遇的喪失而停滞,進而表現出退縮之勢。與此同時,結合前文關鍵詞總體分布結果,由于在基于裁判文書法學實證研究發展的各個階段均繞不開對于刑事訴訟領域問題的專門 研究,以及以刑事訴訟實踐為基點對相關問題的分析探讨,故難以認定基于裁判文書法學實證研究 者們的視域得到了本質性拓展。

而從理論上來說,實證研究作為一種獨立的研究方法,其所針對的研究對象具有廣泛性,即便是将其嚴格限定在以具有數量變化關系的法律現象為主要研究對象的定量研究範圍之内,該廣泛 性依然存在。實證研究方法要得到發展并實現其自身價值,需要立基于習慣傳統研究方法的學者對其自身的認可與接納,進而主動對實證研究方法的研習。然而,對于實證方法在本領域的适用, 不同法學研究領域學者所持堅守教義學陣地之信念有所差異。實證研究方法的适用最早開始于刑事司法領域,其在該領域的認可與接納程度較高。而以民法領域為代表的其他領域學者,對于實證研究方法在本領域的适用均在一定程度上持保守态度,即便是認為實證方法對本領域研究有所裨益的學者,也認為法律實證研究方法隻能針對個别問題的、點對點的零碎研究方式,隻能為法教義學提供體系建構、融合之素材,無法擔負起法律體系建構與融合的任務,“扛大旗者”非教義學方法莫屬。故而,法學實證研究的研究領域,可能受傳統研究理念的影響,在學科分布上存在一定的局限性。與此同時,在當前學界推崇使用統計分析模型進行定量研究的趨勢下,具有數量關系的法律現象是我國法學實證研究的重要研究對象。該類法律現象中,部分數量關系表現得較為直觀,可在相關的資料信息載體中直接體現出來,研究人員可通過直接觀測來實現對于數量關系的萃取與分析;另一部分數量關系,則并在資料信息載體中得以直觀顯現,需要研究人員投入更多的成本,并借助一定的技術方法來實現對于數量關系的抽象與提取,即對研究人員對于方法的理解及方法适用能力要求高于直觀數量關系。而數量關系直觀程度的差異,在裁判文書之中同樣客觀存在。其中刑事審判結果中所體現的法定刑與宣告刑之間數量關系,即是直觀數量關系的典型。對于意欲從事實證研究以及剛剛步入法學實證研究領域的學者而言,成本投入大小以及方法适用的難以程度是其開展實證研究的重要考量因素。申言之,對于裁判文書之中數量關系抽象的難易程度,也在一定程度上影響基于裁判文書法學實證研究所涉足的具體學科領域。
二、基于裁判文書法學實證研究演變内因剖析
盡管被視為法學實證研究發展契機的裁判文書公開數量提升,能夠在一定程度上對特定時期 研究成果數量的發展變化之緣由予以解答,但對于基于裁判文書法學實證研究的總體概況,尤其是 發展過程中所存在的具體問題,則明顯缺乏解釋力。故此,在當前法學方法轉型的外部環境之下, 對于基于裁判文書法學實證研究發展演變之内因,還需進一步基于方法論視阈予以闡釋。具體而言,依據以數據資料收集方法為标準所進行的社會科學研究方法劃分,基于裁判文書法學實證研究 中所适用之主要方法為内容分析法,即對裁判文書中所承載的内容做客觀的、系統的量化描述和分析。對基于裁判文書法學實證研究發展演變内因之闡釋,應圍繞内容分析法自身的優勢與缺陷來展開。
(一)從數據可得性方面的分析
适用内容分析法開展實證研究,需要在獲取原始數據載體的基礎上,進一步提取可為分析所用的标準化數據。因此,對于數據可得性,需要從原始數據可得性與标準化數據可得性兩個層面予以闡述。
1.原始數據可得性
實地調查、訪談、問卷調查等其他較為常用的社會科學研究方法,均需要預先制定較為複雜的 數據獲取方案,即如何對研究所需數據進行獲取并得以客觀記錄,并需要組建相對龐大的研究團隊,才能夠切實有效地獲得開展後續研究所需要的原始數據,進而對原始數據進行編輯整理獲得研究所需的最終數據。對于内容分析法而言,在開展數據整理與分析之前,研究所需的具體數據已 經被客觀地記錄于相應載體之中,研究人員僅需要直接對相關數據載體進行獲取,即可在一定程度上被認為已經實現對于研究所需原始數據的獲取。申言之,通過比較内容分析法與其他類研究方法的數據獲取過程可知,内容分析方法在原始數據獲取方面具有較為明顯的便捷性。當然,在方法适用過程中,内容分析法較之于其他分類方法的便捷性優勢能否得以體現,還需取決于數據載體獲 取的便捷程度。如若數據載體獲取足夠便捷,内容分析法的實施甚至可以無需組建研究團隊,而由一人獨立完成數據獲取工作。
對于仍然處于探索起步階段的法學實證研究學者而言,研究成本的降低,即意味着研究開展可行性提升。據此,前文概況檢視部分所揭示的,基于裁判文書法學研究成果數量在裁判文書公開制度施行初期的顯著增長得以解釋。即該階段基于裁判文書法學研究成果數量,源自于裁判文書網絡公開對于研究開展便捷性的本質提升。
2.标準化數據可得性
對于大部分研究方法而言,在開展具體的數據分析之前,都需要經曆由原始數據向标準化數據 的轉化。内容分析的基本做法是對數據載體中的信息進行編碼,即根據特定的概念框架,對載體中的信息進行分類記錄,以獲得标準化數據。普遍意義上而言,内容分析法與其他方法在标準化數據可得性方面并不存在明确差異。然而,随着計算機與信息科學等相關領域的迅速發展,借助于技術手段的應用,社會科學研究中數據提取的效率得以顯著提升,但基于待提取數據類型之間的差異,技術手段應用所産生的效果也并不一緻,并最終在一定程度上導緻研究進程中數據提取效率的高下之分。
就數據結構類型而言,數據形式主要可分為結構化數據、非結構化數據與半結構化數據三個類型。其中結構化數據,即包括預定義的數據類型、格式和結構的數據,通常以二維表形式保存;半結構化數據系指具有可識别的模式并可以解析的文本數據文件,通常情況下是指XML數據文件; 而非結構化數據則是沒有固定結構的數據,通常保存為包括文本文檔、圖像和視頻在内的不同類型的文件。由于結構化數據自身具備固定的類型、格式與結構,在進行數據分析之前并不需要對結構化數據進行過多處理,甚至可直接被用于數據分析與挖掘。但其他兩種類型數據,尤其是非結構化 數據,在進行數據分析與挖掘之前,往往需要對其進行深入處理使其轉變為符合分析要求的結構化數據。現階段,裁判文書基本以純文本形式公開,即屬于典型的非結構化數據。
而實際上,在我們現階段所處的大數據時代,作為數據處理的重要内容,如何将非結構化數據與半結構化數據轉化為可供使用的結構化數據不僅是大數據技術領域的關鍵技術之一,同時是大 數據技術所面臨的關鍵問題之一。具體到計算機技術實現層面,數據處理,尤其是文本内容抽取的 有效實現,在極大程度上依賴于自然語言處理技術的發展與應用。通過讓計算機“理解”自然語言,從而實現對以文本數據為典型非結構化數據的信息提取,進而實現非結構化向結構化的轉變。然而,就當前研究與應用成果來看,自然語言處理技術對于法學研究中的數據處理能夠提供的支持 十分有限。裁判文書作為典型的非結構化數據,當然也面臨着數據轉化方面的技術難題。而當缺 乏有效技術支持時,數據量級的增長,即意味着人力成本增加,很顯然,這是目前以裁判文書為實證研究數據來源的一個重要缺陷。
因此,對基于裁判文書法學實證研究成果數量在2019年的急劇下降,我們可以尋得部分合理解 釋。随着計算科學等相關領域的快速發展,大數據不斷被各領域所推崇,法學領域也不例外。近年來,法學領域不斷有學者強調在大數據在法學領域的适用,并在強調全樣本優越性的基礎上提倡獲取全面多樣數據。在當前裁判文書公開數量不斷攀升的情勢之下,獲取全面多樣數據,即意味着數據量級的增長,進而使得研究成本大幅提升。在研究方法轉型的背景之下,相對于傳統研究方法對于文獻資料的梳理,大數據獲取對于人力物力需求的明顯增加,可能使得基于裁判文書法律實證研究的開展面臨困境,也可能使得意欲嘗試研究方法轉型的研究人員望而卻步。在“小數據”研究成果認可程度降低,“大數據”研究開展受阻的情境之下,實證研究成果的下降不可避免。
(二)從數據完整性方面的分析
數據分析之目的,在于從直觀數據之中,提取出有用的信息和知識。毋庸置疑,數據的完整性 可以影響到所提取信息和知識的價值與厚度。涉及到目的性較強的數據分析,如果關鍵性數據的缺失,甚至可能導緻分析目的無法實現,從而進一步導緻整體研究方案的可行性喪失。對于完全依賴于既有數據資料的内容分析法而言,由于可獲取數據的完整性不由研究人員所掌控,可獲取數據的完整性程度不僅會影響到研究結果的可靠性及價值,甚至導緻研究目的難以實現。而具體到基于裁判文書的實證研究中,由于現階段我國裁判文書公開所存在的缺陷,使得數據獲取缺乏完整 性成為内容分析方法相對于其他方法所表現出的主要劣勢之一。
從我國現階段數據公開來看,公開數據的完整性依然存在較大的問題。基于裁判文書法學實證研究自身,則在原始數據與标準化數據獲取兩個層面都可能面臨數據完整性問題。從原始數據 層面來看,目前裁判文書網公開的裁判文書數量與當年實際審結案件數量仍然存在較大差距,更為重要的是,裁判文書公開比例與案件類型、審判層級以及地域等因素均存在極為明顯的相關性。而從标準化數據層面來看,依據裁判文書制作規範,裁判文書主要對案件審理相關之要素進行記載,對于案件審理過程中所涉及的部分案件信息,在裁判文書制作過程中不可避免地需要進行簡化 甚至省略。并且,雖然現行規範對于裁判文書的撰寫進行了較為明确的規定,但基于法院即審判人員自身的主觀原因,不同審判人員、不同法院之間出具裁判文書中所記載的具體内容可能存在差 異,部分審判人員依據其主觀意願進行裁判文書制作時,即便是必需承載的案件要素信息同樣可能被其進一步簡化甚至省略。
裁判文書在總體上公開的不完整性,導緻公開數據與真實數據總體存在非一緻性,從而進一步 導緻基于不完整公開數據進行全樣本或抽樣分析所得出的研究結果與真實情況存在偏差,從而降低總體研究的可靠性。與此同時,裁判文書公開比率過低,會在一定程度上實證研究可用數據總量造成限制。而公開比率與案件類型等之間所存在的明顯相關性,則會導緻拟适用具體案件類型裁 判文書開展實證研究的可行性差異。回歸到前文所論述的研究領域中,由于案件類型與學科領域分布密切相關,公開比率與案件類型相關性所導緻的可行性差異,最終将表現為研究成果在學科領域部分上的差異性。申言之,對于前文所揭示的研究領域分布集中趨勢,除教義學方法堅守信念以及方法适用難易程度外,還可能受當前裁判文書公開缺陷之影響。
(三)從數據客觀性方面的分析
内容分析法還具有另一個重要特性,即其無需對研究對象進行介入,無需與研究對象交流與互動。實際上,基于内容分析法無需介入研究對象的特質,其也被劃歸為“非介入性研究法”。而非介入性研究法的優勢,則在于,可以避免來自研究對象的主觀因素幹擾,進而确保所獲取之數據的客觀性。
具體到基于裁判文書法學實證研究之中,其研究對象所涉及之個體主要以法官為主。任何職 業都會或多或少地伴随着一定的職業風險,而法官職業風險則來源于裁判權運行中對外或者對内 發揮作用是對法官自身産生的負面影響,這種負面影響則可以表現為對法官的心理壓力、身體損害、各種形式的責任承擔等等。在裁判權行使過程中,事實認定、适用法律、裁判可改變性及社會質疑等都可能引發相應的法官職業風險。縱觀我國司法體制改革曆程,制度設計所體現出的司法體 制改革理念則主要在于防範權力濫用,而非在注重法官職業保障的基礎上保障權力實施。正确行使裁判權可以有效降低法官所面臨的執業風險,但基于司法裁判本質,裁判過程中的事實認定與法律适用均具有一定的不确定性,裁判結果并不能完全避免錯誤出現。故此,對于我國法官而言,面對來自司法責任制與内部考核制度方面的壓力,以及裁判錯誤的不可避免性,出于規避風險之目的,其必然不希望裁判行為被過分研究和解讀,以産生對其自身的不利的負面影響。申言之,對于任何研究對象的介入,都可能受主觀因素之幹擾,但在我國法官所處的制度環境之下,介入性研究 受到幹擾的可能性及程度相對更高。
為盡可能避免受到來自研究對象的主觀因素幹擾,研究人員在适用介入性研究方法獲取數據時,需要在全面了解可能出現之幹擾因素的基礎上,不斷調整與完善數據采集方案。以問卷調查法為例,為盡量保證數據客觀性,問題本身是否清晰、問題長度是否适宜、問題本身是否包含偏見都需 要根據研究目的及研究對象的具體情況進行設計與調整。對于知識體系相對單一的國内法學研究者而言,在缺乏系統實證研究方法教育的情形下,基于介入性研究方法所獲取數據的客觀性必然更加容易受到質疑。質言之,适用内容分析法所獲取數據的客觀性更容易得到認可,基于客觀數據 所得出之研究結論必然更易為評閱者所接受。據此,研究成果數量與裁判文書網絡公開數量增長的高度契合,除裁判文書可得性外,還應當受到研究成果接受程度之影響。即,較高的接受程度,使得基于裁判文書法學實證研究的直接産出更易轉化為公開發表的研究成果,從而縮短裁判文書網 絡公開數量增長與研究成果數量增加之間的時滞。
當然,在當前強調“大數據”,且數據提取技術尚未成熟之時,基于裁判文書法學實證研究同樣可能面臨數據客觀性方面的問題。具體而言,研究人員在進行編碼的過程中,對于編碼所需的特定 概念框架,需要通過理解數據載體所承載的具體内容進行抽象與确定,而基于主觀認知的差異,以及閱讀順序差異等外在因素,對于具體信息内容的理解,在不同的研究人員之間則可能會存在一定 的差異,進而影響到編碼結果的統一性與客觀性,當數據載體所承載的内容主觀性非常強時,此類 問題則會更加凸顯。申言之,當一項适用内容分析法的研究需要由多個研究人員同時進行數據編 碼工作時,同樣可能引發數據客觀性問題。
三、基于裁判文書法學實證研究推進路徑的思考
囿于傳統研究方法在研究對象方面所存在的局限性,以法律現象中的數量關系為主要研究對象的實證研究方法,因有助于全面把握法學研究對象,故有其在法學領域存在與發展之價值與必要。因此,在明确發展概況及與其相關影響因素的基礎上,為謀得基于裁判文書法學實證研究之長遠發展,除針對數據公開及技術發展方面的宏觀政策與制度支持外,研究人員同樣應當以研究方法為基點,在研究過程中積極主動尋求針對當前所處困境的破局之道。
(一)豐富數據來源
現階段,我國法學實證研究水平尚待提高,尤其是在團隊建設觀念及團隊協作能力都亟待提高 的情況下,利用公開數據進行實證研究仍然是最為行之有效且可靠性最強的研究方式。具體到基 于裁判文書法學實證研究中,基于公開數據對研究方法的完善,即可主要表現為,在堅持适用内容 分析法的基礎上,以裁判文書所承載内容為依據,通過廣泛搜集其他公開數據載體來充實可用于實 現研究目的的數據類型與總量。以基于裁判文書法學實證研究成果中所涉及主要研究内容中的司 法鑒定而言,裁判文書中通常僅對出具鑒定意見的司法鑒定機構以及司法鑒定人名稱進行簡單記 載,而更為詳細的信息則均由司法鑒定行政管理部門進行登記與公開。如若需要研究司法鑒定機 構以及司法鑒定人所具有特性對鑒定意見審查結果的影響時,除去裁判文書中對于鑒定意見審查 程序及結果的記載,司法鑒定行政主觀部門所公開的司法鑒定機構及司法鑒定人登記信息也是實 現分析目的的重要數據來源。并且,由于該部分登記信息均得以通過互聯網渠道公開,對于項目開 展所需人力成本的影響也十分微小,因而該種研究方法完善途徑具有較高的可能性。
當然,基于内容分析法自身的局限性,以及我國現階段的信息公開制度,并非所有與裁判文書 相關數據均能從公開渠道獲得。此時,對于研究方法的完善則意味着對于其他研究方法的引入。例如,當研究目的的實現需要分析審判人員背景信息,尤其是涉及審判人員性格特征等非公開資料 能獲取的信息時,裁判文書不會對該部分信息予以記載,而對于該部分信息的獲取需要對審判人員進行介入,此時,内容分析法作為非介入性研究方法,當然無法再有效滿足分析需求。在此種情況 下,研究人員則可以借用問卷調查法或觀察法,對于該部分數據資料進行補充。具體而言,研究人 員可通過向具體審判人員發放問卷,或對審判人員進行觀察訪談,獲取審判人員的背景特征信息, 然後再結合承載該部分審判人員具體審判過程的裁判文書實現最終的研究目的。誠然,由于其他 研究方法的數據獲取并沒有相對于裁判文書可通過統一平台進行獲取的便捷性,其他方法的引入, 對于整個研究項目的影響并非簡單的導緻研究成本增加,而是直接影響抽樣方案的制定,進而造成 整個研究方案的變化。
綜上,對于裁判文書内容承載局限性所造成的阻礙,研究人員可以通過完善研究方法的形式予以彌補,對于研究方法的完善,以擴充數據類型與總量為目的,可以内容分析法為基礎,通過公開渠道對研究所需數據進行擴充,也可以内容分析法為中心,引入其他研究方法。而具體完善方案的選擇,則需要對研究目的實現、成本投入等多方面因素進行考量。
(二)科學适用實證研究方法
對于适用内容分析法的實證研究而言,除定量分析中對于統計分析方法的理解與适用較易出 現問題外,如前文所述,數據的采集與提取更可謂 “雷區”。故此,謀求基于裁判文書法學實證研 究的長遠發展,必然無法繞開對于研究方法适用的規範。與此同時,由于知識體系集體單一,所接受的研究方法教育均以教義學方法為主,法學研究者關于實證研究方法的知識儲備匮乏,缺乏系統 量化研究思維。對于研究方法适用的規範,應以提升研究人員對于方法本身的理解與認知,并實現 期思維從定性到定量之轉換為前提。
1.規範研究方案的制定。
任何研究項目的順利開展,都需要事先制定一個完整的研究方案,對研究實施的細節問題和實 施步驟進行明确。對于基于裁判文書的實證研究而言,如上文所述,如何正确采集裁判文書,以及如何準确地從裁判文書中抽象與提取數據,都需要在項目實施前予以明确。尤其對于需要團隊協作的項目,事先制定詳細的研究方案對于提升項目成員執行項目的規範性與統一性尤為重要。具體而言,基于裁判文書的實證研究方案,除研究方案普遍應當具備之内容外,還應着重強調以下幾點。第一,裁判文書抽樣方案,包括抽樣範圍與比例的确定,以及在裁判文書總體不可得的情況 下,通過制定适當的抽樣辦法以确保抽樣的随機性與準确性。第二,數據編碼規則,如前文所述, 内容分析法最為基本的做法即為對載體中的信息進行編碼,事先制定詳細的數據編碼規則有利于 研究人員在對裁判文書内容進行抽象的過程中概念統一,從而提升數據提取的有效性。而在量化 實證研究之中,數據編碼即定性内容向定量數據轉變之關鍵。第三,明确團隊成員分工,尤其在數 據采集與提取過程中,應當明确各個研究人員的職責範圍,以避免造成數據采集與提取的重複或遺 漏,提升項目執行之效率。
2.提升團隊協作能力與效率。
如前文所述,由于輔助技術對于法學實證研究,尤其是對于數據處理方面的支持十分有限,現 階段基于裁判文書的實證研究開展,仍然需要以人工閱讀與整理的形式完成裁判文書内容的提取, 以及将定性内容轉化為定量數據。然而,傳統的法教義學研究,對于團隊運行的形式并不十分依賴,通常隻需要較少的研究人員,甚至是單獨的研究人員即可形成具體的研究成果。從傳統研究方法向定量的實證研究方法的轉變,尤其是向需要耗費大量人力資源的裁判文書分析研究來說,如何适應團隊協作,并提升團隊協作與效率,同樣是現階段謀求基于裁判文書的法學實證研究發展所需解決的問題。具體而言,實質開展研究項目前,在研究方案中對團隊成員分工進行明确的基礎上, 還需要在項目開展前對研究人員進行培訓,并在項目開展過程中注重研究團隊之間的溝通交流。而從長遠發展來看,組建較為固定的研究團隊,則是提升協作能力與效率的重要基礎。
3.重視研究結果的檢驗。
社會科學研究中任何一種精确的、系統的收集資料的方法,實際上都是一種特定形式的社會測 量,而為了衡量收集資料的準确性,以及依據該部分數據資料分析所得的研究結論是否具有穩定性,任何研究成果均需接受信度與效度的檢驗。法學作為一門社會科學,内容分析法作為一種特 定的資料搜集方法,基于裁判文書的實證研究結果必然也需要接受信度與效度檢驗。尤其是在多 人協作進行裁判文書内容提取的時候,為确保研究結果盡量少的受到數據提取瑕疵或錯誤的影響, 對于研究結果的檢驗顯得更加必不可少。對于使用通過抽樣所獲得小數據進行分析的實證研究而言,抽樣方法的合理性則為影響最終研究結果穩健型的關鍵因素之一。在當前國内法學研究群體 普遍缺乏實證研究系統知識背景及方法适用經驗的背景下,研究人員不應對自身所開展的研究及 所獲得之結果過分自信,結果的穩健型必然應以檢驗結果為依據。研究成果受衆,無論是期刊編輯 還是政策制定者,對于研究結果可靠性的判斷同樣應以檢驗結果為标準。然而,從現階段已有的基 于裁判文書的研究成果來看,至少在期刊論文之中,極少存在研究人員對研究結果進行穩健型檢驗。而基于前文對研究成果數量變化趨勢的分析,可以推測,當前法學實證研究領域對與研究結 果檢驗的忽視,可能導緻了不利于本領域發展的極端現象,即将研究數據的“量”與研究結果的“質” 進行絕對性關聯,進而導緻學界對于“量”的過分推崇,并最終導緻近年來法學實證研究發展步伐放緩。為此,為提升基于裁判文書的實證研究成果在法學研究領域的認可度,以謀求法學實證研究的長遠發展,研究人員應重視對于研究成果信度與效度方面的檢驗,無論是全樣本“大數據”,還是抽樣“小數據”,從純粹的學術研究角度而言,隻要方法适用得當且研究結果符合穩健型檢驗要求,即應當被認可。
(三)推動數據處理技術的發展
從本質上來講,提升裁判文書内容提取效率的根本之策應在于加速相關數據處理輔助技術的 發展。對于裁判文書内容提取而言,核心的數據處理輔助技術即為自然語言處理技術。而自然語 言處理技術的發展,及其在法學研究領域的有效應用,則是法學領域研究人員可以切身參與的。
數據處理技術的核心在于自然語言處理,而自然語言處理作為一項跨學科研究領域,其在特定 領域範圍内的研究與應用必然離不開本領域專家學者的參與。自然語言處理研究早期,基于規則 的自然語言處理方法,需要依靠本領域專家耗時數月或者更長時間總結并參與編寫語法規則,而機 器學習以及現階段推動了自然語言處理技術飛速發展的深度學習方法則需要基于大量本領域數據 進行長時間地訓練才能不斷提高數據處理的準确率,機器訓練的過程同樣需要本領域專家的參與, 以更好地引導機器做出涉及本領域專業知識的正确判斷。因而,要實現自然語言處理技術在特定 領域的應用,則不可避免地需要本領域專家參與應用程序研制及開發。對于研發機構而言,在應用 層面,基于訓練過程的大量投入,以及應用的領域性,研發人員不得不将産出作為應用程序開發的 一個重要考量因素。相對于諸如金融等高收益、高回報領域,機器訓練階段較大的人力成本投入與預期産出的失調,則正是阻卻自然語言處理領域研究成果在法律行業有效應用的主要原因之一。因而,法學研究學者作為本領域的專業人員,如果能通過其自身對于自然語言處理技術與應用産品 研發過程的參與來降低法律行業應用程序研制開發成本,則能有效降低研發機構在投入産出方面 的顧慮,進而促進研發人員在從事法律行業領域自然語言處理技術與應用産品研發方面的積極性, 并最終導緻法律行業領域自然語言處理技術的提升及相應應用産品的出現。
通俗來講,單純的基于自然語言處理技術的法學研究輔助工具及軟件研發并不能為投資者及研發 人員帶來可觀的經濟收益,但自然語言處理技術本身确是目前蓬勃發展且商業利益巨大的高階人工智能産品開發之基石。由于基于自然語言處理技術的法學研究輔助工具及軟件的應用可以間接地吸納 較多地本領域專家對于機器訓練過程的參與,如果可以創建一種雙赢模式,使法學研究人員及軟件開發主體均能在技術應用中獲利,即可有效促進數據處理技術在法律行業的有效利用,進而推動基于 裁判文書法學實證研究的進一步提升與發展。具體而言,軟件開發主體可先投入少量成本研發出具備一定數據處理能力的軟件産品,并以開源形式供本領域專家學者做學術研究之用,從而使得專家學者可以在學術研究過程中獲得計算機技術的輔助與支持,而軟件開發人員則可以通過專家反饋實現對于機器的訓練,訓練完成之後則可進一步用于開發更加高階的人工智能産品。