最新消息

閱讀更多

最新消息

閱讀更多

最新照片分享

閱讀更多

研討會內容

研討會名稱【生物統計中心講座】《課程一》R軟體在中文文字探勘的應用(14:00-16:30 ) 《課程二》文字挖掘的在各領域的應用(16:30-17:30)
開始日期2015-06-29 14:30:00
結束日期2015-06-22 17:30:00
活動說明《課程一》
【主題】:R軟體在中文文字探勘的應用
【課程介紹】:「文字探勘」(Text Mining) 是利用資料探勘以及其他技術於文字資料分析的特殊技術。文字探勘的主要功能是從非結構化或半結構化文件、甚至是音樂、圖檔、影片中,擷取隱晦有用的片段、模型或規則,以及尚未被發掘、有潛在價值的資訊或知識。此外,由於中文不像英文一樣容易斷詞,加上中文文法的差異,中文文字探勘並不像英文文字探勘那麼容易入門。
除了商業文字探勘軟體之外,國內外各界目前廣泛使用R軟體來作文字探勘的分析任務。我們將介紹R軟體在中文文字探勘的應用,包含中文斷詞、語料庫的建構、文件與詞彙的分群與分類、主題模型區分,以及情感分析或輿情分析的應用。
【講師簡介】:陳景祥 副教授 (淡江大學統計系)
【時 間】:104年6月29日(ㄧ) 14:00-16:30
【地 點】:口腔醫學院二樓階梯教室

《課程二》
【主題】文字挖掘的在各領域的應用
【課程介紹】由於電腦及網路的快速發展,過去傳統紙質書面資料大多變成電子檔的形式呈現,因此資料的取得比過去要容易許多,大多訊息都可由網站搜尋獲得。但是這些文字資料通常是以半結構化或非結構化的形式儲存。“非結構化資料”是指一般的檔,其內容沒有一定的格式,每份資料間沒有共同的結構性,卻不一定能發現檔中所隱藏的訊息,容易忽略某些對我們有用的重要資訊。
文字挖掘(TextMining)主要定義為“從非結構化的文字中發掘有用的片段、模型、方向、趨勢或規則”,另外也有學者定義為:“是一種編輯、組織及分析大量檔的方法和過程。”一般的統計分析或資料採擷的方法,只適用於結構化的關聯表格資料,無法直接運用到非結構的檔資料上,而一些已發表的文本挖掘研究中結合了資訊檢索(Information Retrieval)、自然語言處理(Natural Language Processing)和語義分析技術,試圖從檔資料中找出重要的專案(Term)、片語(Phrase)、項目間的關聯強度(Association Degree)。
在現今充滿著大數據的時代中,除了能利用量化的資料去分析外,質化的資料中更含有大量的資訊,如何利用「多維度分析」去幫客戶創造價值,正是TextMining的所用之處。並利用文字挖掘分析結果,得出資料價值。並透過各領域的應用,如:商品銷售、行銷導購、社群操作、危機預警、選戰策略、社會網絡等。幫企業及客戶創造價值與利益。
【講師簡介】:謝邦彥 講師
【時 間】:104年6月29日(ㄧ) 16:30-17:30
【地 點】:口腔醫學院二樓階梯教室


【對象】全校教職員、三院同仁及學生
【承辦單位】生物統計研究中心
【聯絡窗口】曾馨頡(ext8678)
主要聯絡Mailatzeng@tmu.edu.tw
參考連結
附件檔案