【生物統計中心講座】《課程一》R軟體在中文文字探勘的應用(14:00-16:30 ) 《課程二》文字挖掘的在各領域的應用(16:30-17:30) - 學術活動網Events@TMU

最新消息

閱讀更多

最新消息

閱讀更多

最新照片分享

閱讀更多

研討會內容

研討會名稱	【生物統計中心講座】《課程一》R軟體在中文文字探勘的應用(14:00-16:30 ) 《課程二》文字挖掘的在各領域的應用(16:30-17:30)
開始日期	2015-06-29 14:30:00
結束日期	2015-06-22 17:30:00
活動說明	《課程一》【主題】：R軟體在中文文字探勘的應用【課程介紹】：「文字探勘」(Text Mining) 是利用資料探勘以及其他技術於文字資料分析的特殊技術。文字探勘的主要功能是從非結構化或半結構化文件、甚至是音樂、圖檔、影片中，擷取隱晦有用的片段、模型或規則，以及尚未被發掘、有潛在價值的資訊或知識。此外，由於中文不像英文一樣容易斷詞，加上中文文法的差異，中文文字探勘並不像英文文字探勘那麼容易入門。除了商業文字探勘軟體之外，國內外各界目前廣泛使用R軟體來作文字探勘的分析任務。我們將介紹R軟體在中文文字探勘的應用，包含中文斷詞、語料庫的建構、文件與詞彙的分群與分類、主題模型區分，以及情感分析或輿情分析的應用。【講師簡介】：陳景祥副教授 (淡江大學統計系) 【時間】：104年6月29日(ㄧ) 14:00-16:30 【地點】：口腔醫學院二樓階梯教室《課程二》【主題】文字挖掘的在各領域的應用【課程介紹】由於電腦及網路的快速發展，過去傳統紙質書面資料大多變成電子檔的形式呈現，因此資料的取得比過去要容易許多，大多訊息都可由網站搜尋獲得。但是這些文字資料通常是以半結構化或非結構化的形式儲存。“非結構化資料”是指一般的檔，其內容沒有一定的格式，每份資料間沒有共同的結構性，卻不一定能發現檔中所隱藏的訊息，容易忽略某些對我們有用的重要資訊。文字挖掘(TextMining)主要定義為“從非結構化的文字中發掘有用的片段、模型、方向、趨勢或規則”，另外也有學者定義為：“是一種編輯、組織及分析大量檔的方法和過程。”一般的統計分析或資料採擷的方法，只適用於結構化的關聯表格資料，無法直接運用到非結構的檔資料上，而一些已發表的文本挖掘研究中結合了資訊檢索（Information Retrieval）、自然語言處理（Natural Language Processing）和語義分析技術，試圖從檔資料中找出重要的專案（Term）、片語（Phrase）、項目間的關聯強度（Association Degree）。在現今充滿著大數據的時代中，除了能利用量化的資料去分析外，質化的資料中更含有大量的資訊，如何利用「多維度分析」去幫客戶創造價值，正是TextMining的所用之處。並利用文字挖掘分析結果，得出資料價值。並透過各領域的應用，如:商品銷售、行銷導購、社群操作、危機預警、選戰策略、社會網絡等。幫企業及客戶創造價值與利益。【講師簡介】：謝邦彥講師【時間】：104年6月29日(ㄧ) 16:30-17:30 【地點】：口腔醫學院二樓階梯教室【對象】全校教職員、三院同仁及學生【承辦單位】生物統計研究中心【聯絡窗口】曾馨頡(ext8678)
主要聯絡Mail	atzeng@tmu.edu.tw
參考連結
附件檔案