機器學習對法律產業產生衝擊,本來是把掃描好的pdf上傳到雲端給印度外包公司處理,現在是上傳到新創提供的雲端,直接由機器學習的軟體處理。(資料照,美聯社)
「所以你覺得已經開始了嗎?」
「當然已經開始,我最近就有碰到一家新創,他們提供的服務是用機器學習幫你分析主審法官過去所有的審判文、期刊論文和著作,然後讓機器幫你擬開庭陳詞和結案陳詞草稿,用的是這個法官可能比較聽得進去的語氣和語法,避免引用他不喜歡的判決先例之類的。」
麥可仔細地用抹刀把半鹽奶油抹平在切成對半的法國麵包上,然後撕下袖珍果醬瓶上的封條,旋開瓶蓋,用小湯匙挖了一球鮮紅色的半透明凍狀體,傾倒在剛被抹平的奶油上,然後用抹刀的另一面將果醬來回均勻抹平,邊不時把不小心溢出麵包邊緣的部分救回來,直到整個麵包斷面上在陽光下同時閃耀著誘人的金黃和粉紅,然後才好整以暇地將一端送入嘴中,狠狠咬下一口。
麥可是美國人,在倫敦和阿姆斯特丹執業律師多年,擅長英美法與國際法,經手的主要為大型企業併購案。他的英語有著東岸的節制與內斂,句法略嫌冗長,但他那光可鑑人的頭下是一顆非常重視細節的大腦,對於經濟和金融議題求知若渴。
我和麥可是HEC Paris MBA前後屆校友,原本只是每隔一陣子會一起喝杯酒閒聊,但自從他去年在臉書上一系列的貼文預測川普當選成真後,我就開始仔細閱讀那些放在臉書上絕對過長的貼文,進而開始跟他有更多的深入對話。這一天我們是約在聖日爾曼哲沛的雙叟咖啡館,悠閒地坐在露台上,享用以過去雙叟的名人常客存在主義大師沙特為名、但其實就只是多了一籃可頌的法式早餐。
基於我們兩個的職業背景,聊到機器學習對於法律產業的衝擊也是理所當然的。事實上美國的法律產業在過去10多年已經先經歷過第一波衝擊:就在美國企業將大量IT業務外包到印度時,美國的律師事務所們也爭先恐後地把過往由法律助理(paralegal)負責的工作,打包成電郵和雲端資料夾送到印度去。
「傳統上律師幫企業打官司,第一個動作就是申請法庭命令,向對方公司要求提供大筆相關資料。這些資料動輒一百盒紙箱上下, 律師事務所第一個工作就是將這些資料仔細地閱讀過並且分門別類。這個工作效率甚低,往往花好幾天每天工作10幾小時,也找不到一個對案子有用的資料,因此律師事務所才會聘請法律助理,這些還沒成為律師的有志青年工作的一部分就是閱讀和分析這些原始資料——當然這些鐘點費用都會照律師事務所標準算,不會因為他們是助理就打啥折扣。」
麥可推了推鼻梁上的黑框眼鏡,喝了一口牛奶咖啡後繼續說道。
「但過去10幾年,如你所知的,這些工作很多都外包到印度去了。所以白天我們去對方公司搜集資料,複印裝箱,搬上車子後回到事務所,然後讓秘書或者工讀生掃描成pdf檔,晚上10點多下班前上傳到雲端,把權限設好就可以回家了。同一時間印度的外包公司已經醒來,準備上班。他們的員工英語也許有濃烈的腔調,但讀寫幾近完美,印度時間一早開始就可以處理。等到他們傍晚6點下班,我們東岸也醒來開始上班,正好可以開始分析他們當天處理完的部分。」
「我知道,這個已經走了10多年的趨勢對美國法律學校和產業造成巨大的衝擊,過往法律學校畢業生加入事務所後先擔任法律助理,考過bar,負責你講的這些資料搜集和分析的工作多年後,才有機會成為真正的律師,開始接案。但這個部分的大量外包,使得許多律師事務所不再聘用法律助理,不只法律學校的畢業生失業率年年升高,從法律學校到律師的養成路徑也斷掉了,影響甚鉅。」
「是啊,然後正如作為風險資本家的你也知道的,最近的機器學習風也吹進了法律產業。我剛剛講的那間草擬開庭陳詞的新創是一種,另一種更常見的就是處理我上面講的文件分析。所以本來是把掃描好的pdf上傳到雲端給印度外包公司處理,現在是上傳到新創提供的雲端,直接由機器學習的軟體處理。我猜這對亞馬遜的AWS業務應該有加分吧,離峰時間的雲端計算服務變得熱門之類的。」
「喔,那倒不一定,因為亞馬遜AWS雖然打贏了雲端的第一戰,但現在看起來雲端機器學習的戰爭是谷歌的TensorFlow佔了上風,我最近遇到的新創幾乎每間都是使用TensorFlow,其語言也快速地成為雲端機器學習的標準語言。」
麥可邊聽邊點頭,邊叮囑走過身邊的服務生幫我們加水。
「原來如此,我是不太清楚這些技術啦,標準啦,平台啦,不過我真的為現在還在法律學校的學生們擔心,我們這些已經執業多年的其實是受惠於這波新技術的,因為工作變得更快、更有效率而且更少錯誤,但他們要怎麼克服畢業後的職缺巨大斷層,說真的我沒有啥好的建議。」
「反過來從投資者的角度來說,我則是很質疑這些將機器學習應用在法律的新創,他們相對於彼此的競爭優勢到底在哪裡。就像我常講的,機器學習正在快速地民主化,如果使用同樣的資料庫和同樣谷歌的機器學習雲端服務,剩下能夠差異化的只有演算法和商業模式。而演算法的部分,分析書面的自然語言遠比分析語音對話容易多了,所以效能上大概也很快就會拉平。那剩下能差異化的就只有商業模式了,感覺又變成精實新創歷史重演。」
「呃,你說的不完全對,因為我遇到的幾個新創其中一個差異化是在資料庫的部分。」
「咦?法庭文件和判決書不是應該都是公眾資產,任何人都可以取得嗎?」
「訴訟的文件和判決書原則上是如此,但是我們工作範圍內閱讀和參考的資料有很大量都不在公開領域,像是期刊文章,還有我剛剛講的企業資料等。事實上不少老牌事務所的競爭優勢就在於他們已經累積了幾十年的私人資料,雖然這些都是客戶的資產,必須保密,但在事務所內閱讀和分析它們並不是問題。話說回來,這樣好像就不能丟到雲端去了對吧?」
「其實在雲端產業裡一直都有企業內部雲(on-premise cloud),所以並不是啥新鮮的需求。不過以機器學習來說,需要的計算量比起儲存之類的簡單雲應用來說尖峰離峰差距大很多,法律事務所當然也不可能自己聘用這方面的工程師或資料科學家來使用和管理這樣的內部系統,所以雲端可能是唯一的可行方案,保密需求的部分可以用加密或者資料結構的方式來處理,應該沒有太大的問題。」
「原來如此。總之我是很樂見這部分的應用出現,坦白說法律產業裡沒人喜歡處理這些資料,枯燥乏味又曠日費時。我聽說你們台灣人要服義務兵役?我猜大概就跟那個差不多,我當法律助理時每天都在祈禱著這樣的日子趕快結束。」
「但你不擔心法律工作被機器取代嗎?」我笑著問道,但其實心裡已有答案。
「喔,天哪,不!你故意講來逗我的吧?我們這個產業跟你們風險資本產業一樣,核心是人,99%的價值在於談判桌和法庭上,不是在這些文件上。機器可以幫我快速分析完一百箱的資料,或幫我撰寫優美而動聽的開庭陳詞,但我走上台時如果看到法官表情像大便,可能早上才和太太吵過架,可能就得換一種溝通策略。更別說刑事辯護的那些律師,從刪選評審團的階段就已經機關算盡,務求把每個可能對己方不利的評審都剔除,這部分機器可無法代勞啊!反過來,當機器幫我們處理越來越多非核心的工作,我們就更能專注在人的部分,對客戶和對我們自己的荷包都是好的發展啊!」
作者指出,當機器幫律師處理越來越多非核心的工作,律師就更能專注在人的部分,對客戶和對律師自己的荷包都是好的發展。(圖/techstory)
「哈哈哈,我當然理解,只是還是想聽你親口證實,所以今天這頓早餐你請囉?」
麥可大笑幾聲,從外套口袋掏出黑色的Bottega Venetta皮夾,抽出了一張烏漆麻黑的信用卡丟在桌上,然後從另一邊口袋掏出了煙盒,取出一支煙刁進嘴巴,拿起桌上的廉價打火機點燃了煙,深深吸一口後,緩緩吐出⋯⋯
*作者為台灣大學電機畢業,在台灣、矽谷和巴黎從事IC設計超過10年,包含創業4年。在巴黎工作期間於HEC Paris取得MBA 學位,轉進風險投資領域,現為Hardware Club合夥人。
沒有留言:
張貼留言