學術不端檢測系統的研制背景
國內外學術界存在的學術誠信危機現現象
近年來惡劣學術不端事件時有發生,給整個學術界的聲譽造成了極壞的影響。學術界長期形成的科學、誠實、追求真理的象牙之塔的形象受到社會大眾的質疑。有人認為學術界本來是社會道德的最後壹道防線,可惜,現在這最後壹道防線已經被攻破,學術界面臨前所未有的學術誠信危機。
清華大學***教授偽造個人學術成果、北京大學***教授著作涉嫌抄襲他人作品、中國政法大學***教授涉嫌論文抄襲以及漢芯偽造研究成果等媒體曝光事件,無不撕扯著學人們的脆弱的心。這些事件不但發生在學界,而且涉及中國最著名的學術研究機構,有的甚至涉及科學院、工程院院士,經媒體報道後,產生的殺傷力是可想而知的。同時,人們還壹致認可這樣的觀點,即曝光的只是冰山的壹角。
學術不端的問題不僅在中國,在世界範圍內,同樣是壹個令學界頭痛不已的學界“腫瘤”。如2002年曝光的簡·亨德裏克·舍恩造假事件[1], 簡·亨德裏克·舍恩在世界著名的貝爾實驗室工作,他先後在《科學》和《自然》等世界第壹流學術期刊上發表十幾篇論文,被認為是未來的諾貝爾獎得主。然而同行們卻無法重復他的實驗結果,因為他實質上是個造假天才。
還有大家都知道的“韓國黃禹錫造假事件”。韓國首爾大學教授黃禹錫及其合作者在“幹細胞”研究中存在假造論文,編造實驗結果等問題,結果名譽掃地,最終被撤銷教授職務並辭退。
學術誠信引起各國政府及管理部門的高度關註
為了能有壹個良好的學術環境,學術界已經開始行動,同時也引起國際國內有關政府部門的高度關註。世界主要學術大國或大的學術機構大都成立了有關科研誠信的管理機構。如美國的NSF。中國科技部於2006年發布11號部長令,2007年在科技部成立“科研誠信管理辦公室”。科技部聯合教育部、中國科學院、中國工程院、國家自然科學基金委員會、中國科學技術協會等部門,成立科研誠信建設聯席會議及科研誠信咨詢委員會。
教育部發布了《關於加強高等學校學術道德建設的意見》、《關於樹立社會主義榮辱觀,進壹步加強學術道德建設若幹意見》等壹系列文件。科學院與工程院分別發布了院士科研道德自律行為準則。2005年3月,國家自然科學基金委監督委員會發布了《對科學基金資助工作中不端行為的處理辦法(試行)》。
學術不端行為涉及到學術活動的全過程,包括學術研究、學術出版、項目申報、成果鑒定、職稱評定、研究生培養等諸多環節。,在世界範圍來看,發現與規範學術不端現象,主要還是靠教育與個人舉報,缺乏有效的技術輔助手段,同時由於涉及到各種復雜的經濟利益,導致往往投入巨大,成果甚微,甚至於出現“愈演愈烈”的趨勢。無論是期刊出版界、大學、研究院所、還是出版主管部門、科研主管部門、教育主管部門都迫切需要壹個高效的技術措施來幫助管理部門來檢查與懲治學術不端現象。
博士、碩士研究生教育是培養高層次科技人才的重要手段。研究生的教育質量是關系到科教興國戰略能否得到實施的關鍵。十年樹木,百年樹人。要想從根本上遏制學術不端行為,還要從學生時代樹立正確的科學觀與誠信觀。,研究生培養過程中存在的學術不端行為異常嚴重,卻未能得到有關方面的高度重視。在”愛護與保護”的帽子下,使得研究生培養中的誠信問題越演越烈。千裏之堤,潰於蟻穴。建築科研誠信的萬裏長城,必須從研究生乃至大學生教育開始。 研究生培養中涉及到學術不端行為的主要方面。如期刊論文發表、學術會議論文、參加科研項目,最後學位論文撰寫與答辯等過程。在這些環節中都涉及到各種誠信問題。
遏制學術不端行為的有效措施
學術文獻不端現象是重要的學術不端行為之壹,文本復制(抄襲)是學術不端文獻的重要特征。在上世紀70年代,就已經開始計算機程序復制的檢測研究工作。90年代後,隨著互聯網技術的發展,信息內容迅速增多,復制粘貼變得越來越容易與普遍。隨著內容管理與版權保護的需要,文本復制的檢測研究也得到進壹步發展,陸續提出數字指紋、VSM等檢測方法[2]。國外已經有壹些系統在提供使用。如論文作業抄襲檢查平臺TurnItIn,由 iParadigms開發,已經應用於多所高校及科研機構,包括美國加州大學伯克利分校、杜克大學、德國漢堡大學等。 由CrossRef與iParadigms***同開發的抄襲檢測平臺CrossCheck,於2008年6月19日正式啟動。 Thomson和Elsvier宣布將應用CrossCheck進行投稿論文檢測。加拿大Sciworth公司開發的MyDropBox,提供學生作業抄襲檢測服務。MyDropBox使用Microsoft搜索技術,可以檢測互聯網資源、可公***存取的部分數據庫資源(PubMed、FindArticles等)以及機構內部文檔[3]。
中國知網“學位論文學術不端行為檢測系統”
中國知網從2006年開始正式立項研發學術不端文獻檢測系統。在三年的工作中,歷經算法研究、原型系統開發、大規模數據測試、性能測試、系統集成測試等多個階段的艱苦工作,已經達到大規模實用化的成熟程度。