科學技術發(fā)展是一把雙刃劍。作為時代的產(chǎn)物,人工智能的出現(xiàn)推動社會發(fā)展進入一個全新階段,另一方面,人工智能技術的濫用或非誠信使用,又會給社會造成很多負面影響。其中,以AIGC為代表的人工智能技術在科研領域的濫用,就會抑制真正的科研創(chuàng)新。
AIGC技術可以通過排列組織預訓練數(shù)據(jù)生成文本、圖像、數(shù)據(jù)、代碼、視頻等,這些內(nèi)容可能會形成論文或項目申請書,存在觀點剽 竊等隱患,也極易引發(fā)新形式的論文代寫等學術不端行為。根據(jù)Retraction Watch的數(shù)據(jù)統(tǒng)計,自2021年截止到2023年7月6日共有914篇因“Randomly Generated Content(隨機生成的內(nèi)容)”原因被撤稿,約占近三年來撤稿論文總數(shù)的8.34%。
由于當下的AIGC技術生成內(nèi)容無法明確知識來源,加上更加隱蔽的虛 假數(shù)據(jù)“成果”,新形式的論文代寫等學術不端行為,原有的相似度查重和圖像識別等技術逐漸失效,加大了識別這些學術不端行為的難度,對科研誠信提出了新的挑戰(zhàn)。
基于當前新時代下論文學術不端的治理需求,萬方數(shù)據(jù)推出科技論文誠信風險綜合察驗服務——萬方文察。該工具基于萬方數(shù)據(jù)文本檢測、圖像檢測等核心技術及科研誠信大數(shù)據(jù)資源基礎,實現(xiàn)對論文的文本相似性、圖像復用、AIGC文本、引文及作者等多要素的失信風險一站式綜合察驗,為教育、科研、出版、管理等誠信監(jiān)管工作提供便捷服務支撐。
萬方文察服務采用多項關鍵技術為技術支撐,基于海量科技文獻全文比對資源、科研誠信風險大數(shù)據(jù)資源、學術文獻圖像比對庫等資源為大數(shù)據(jù)底座,可支持在線云服務及API接口服務等服務形式,實現(xiàn)“一次提交、多維檢測”的一站式論文風險察驗服務。
在AIGC文本檢測方面,萬方文察服務采用基于深度學習的AIGC識別算法,基于卷積神經(jīng)網(wǎng)絡的強大表達能力,智能感知生成和非生成文本之間的差異,可識別目前較為通用的AI寫作模型,包括不限于ChatGPT、文心一言、GTP3.5、谷歌Bard、通義千問、必應ChatGpt、ChatSonic和其他AI寫作助手生成的中文文本。
除此之外,萬方文察服務還可提供論文圖像檢測、文本相似性檢測以及參考文獻、作者、基金資助等論文屬性風險檢測。
人工智能時代,學術不端更具隱蔽性,形式也多種多樣,給風險察驗帶來了很大的挑戰(zhàn)。萬方文察“以科技打敗科技”,讓論文中的AIGC文本無處遁形,全方面推動科研誠信建設。