文字與資料探勘(TDM)技術是許多機器學習、數位人文和社會科學應用關鍵的第一步,但因著作權法的規範可能使TDM技術的使用受到限制,因此有越來越多國家希望修法來放寬TDM技術應用上的限制。
文字與資料探勘(Text and Data Mining,以下簡稱TDM)技術是將大量的結構化資料與非結構化的文字資料,以電腦化工具將這些資料內所隱含的資訊、知識以及這些資訊、知識的關聯性尋找出來,並歸結出具有代表意義的結果,所以是許多機器學習、數位人文和社會科學應用關鍵的第一步,但因著作權法的規範可能使TDM技術的使用受到限制,因此有越來越多國家希望修法來放寬TDM技術應用上的限制。
TDM與人工智慧
台灣人工智慧學校前執行長陳昇瑋在《人工智慧在台灣》一書,將人工智慧發展史分成三波,第一波是將人類思考邏輯放入電腦的「符號邏輯」(1950~1960)、第二波是將人類所有知識放入電腦的「專家系統」(1980~1990),第三波則是將人類看見之現象放入電腦的「機器學習」,包含傳統機器學習與深度學習(2010~現在)。
「機器學習」是以巨量資料為基礎,研究人員將大量訓練資料提供給電腦,讓電腦從訓練資料中歸納出自己的規則,然後學習。例如提供電腦海量圖片,該些圖片部分有包含某種物品,部分則沒有,再透過資料標記,讓電腦找出該圖片與物品的關聯性,從而理解該物品的輪廓,以有效辨識影像,所以TDM技術是許多機器學習的第一步,也在其中扮演關鍵性角色。
TDM與著作權法
為鼓勵著作人從事創作活動,多數國家制定有著作權法,提供著作人於一定期間內,享有重製、改作、編輯、出租、散布、公開口述、公開播送、公開傳輸等權利。
TMD係以巨量資料的蒐集為基礎,並將這些資料進行擷取、重製並編譯成可進行開採分析的資料庫,以便進行分析利用。若這些資料係受著作權保護,且上述行為未事先取得著作權人的同意,即有侵害他人重製權之虞。此外,研究人員進行合作或審查員進行驗證之行為,亦可能涉著作的重製及公開傳輸,而可能侵害他人的重製權及公開傳輸權。
對此,除Karla Ortiz、Kelly Mckernan、Sarah Anderson等三位藝術家於2023年1月23日在舊金山聯邦地方法院對Stability AI、Midjourney及DevianArt等公司提起著作權侵害等訴訟外,圖庫平台Getty Images亦在倫敦高等法院對Stability AI公司提起訴訟,主張Stability AI公司侵害其著作權。
TDM與著作權法例外規定
著作權除保障著作人著作權益外,亦有調和社會公共利益,促進國家文化發展之目的,因此著作權法所授予之權利並非絕對,國際條約及各國著作權法都允許為特定目的而例外不構成著作權侵害的情形。
TMD技術形式上雖可能存在重製或公開傳輸行為,但一般情形下其利用結果不致影響該著作的潛在市場與現在價值,對著作財產權人之權益影響甚微,若要事先取得著作權人之授權,除會增加相關人員額外的經濟負擔外,因這些資料也可能包括無法識別著作權人或權利人不願授權者,要求取得授權亦有其實踐上的困難,恐不利於人工智慧的研究發展。
對於TMD與著作權法的衝突,美國、歐盟、日本、新加坡及英國等先進國家紛紛透過司法解釋或制定相關規定,來進行因應。
因美國著作權法對於教育和研究等目的之「合理使用」,有靈活的例外規定,其對於TMD與著作權法的衝突,即是透過司法解釋,於個案中彈性適用「合理使用」之規定,並因此判斷TDM使用之合法性。
歐盟則是透過2019年4月公告的「數位單一市場著作權指令」,要求會員國應使研究組織或文化遺產機構,基於科學研究之目的,對於可合法接觸使用(Lawful Access)之著作或其他素材,可進行TDM之重製及資料擷取,無須另外取得著作權人之同意(第3條第1項)。
日本亦於2018年5月修正「著作權法」,規定對於為供資訊的解析使用(包括TMD等)或其他非為自己或他人享受著作所表達之思想或感情為目的之情形,於必要範圍內,得不限方式利用該著作。但依該著作之種類、用途及利用方式,有不當損害著作人利益者,不在此限(第30之4條)。
新加坡則於2021年9月所通過之「2021年著作權法」,增訂「運算資料分析目的」之例外規定,允許利用人得在「進行運算資料分析(包含TMD、機器學習等活動)」或「為進行運算資料分析準備或紀錄」之目的範圍內,對於利用人可合法接觸使用之受著作權保護著作,得進行重製及傳輸(第243~244條)。
英國「1988年著作權、設計和專利法」規定,基於非商業研究目的,對於可合法接觸使用之著作,可進行TDM之重製,而不構成著作權之侵害(第29A條),此外,英國政府於2022年6月28日發布之「人工智慧及智慧財產權:著作權及專利:政府對諮詢之回應」更表示,未來擬增加著作權及資料庫的例外規定,將TDM之合法重製不再限於非商業研究目的,使任何目的之TDM使用,只要符合該例外規定,都不會構成著作權侵害。
結語
我國著作權法雖無前述規定,但因有「合理使用」之概括條款,故可於個案中透過司法解釋,判斷該TDM使用可否適用「合理使用」概括條款,而不構成著作權侵害。然而,因司法判決曠日廢時且有其不確定性,但人工智慧及TDM等技術卻發展迅速且不斷推陳出新,若著作權法缺乏明確規範而待司法決定,投資者及研究人員恐不願投入新技術的研發,以為免研發成功卻遭法院認定侵權而功虧一簣。
因此,台灣若欲鼓勵TDM技術之發展,並提升人工智慧研發能量,應參考歐盟、日本、新加坡、英國等國,於著作權法中增加TMD可合理使用之其情形,才能鼓勵相關技術之研發,使台灣成為人工智慧的發展重鎮。
<本文作者:黃于珊目前為執業律師,輔仁大學圖書資訊與資訊管理雙學士,交通大學科技法律研究所碩士,美國華盛頓大學智慧財產權法碩士,曾擔任系統工程師、專利工程師。專攻領域為智慧財產權法、個人資料保護法、高科技產業議題及資訊通訊法等。>