skip to main content
資源種類 顯示結果: 顯示結果: 查詢種類 索引

以矩陣法在大型資料庫中進行關聯法則探勘之研究

潘冠良 李建億; 資訊教育研究所 2000

線上取得

  • 題名:
    以矩陣法在大型資料庫中進行關聯法則探勘之研究
  • 著者: 潘冠良
  • 李建億; 資訊教育研究所
  • 主題: 資料探勘; 關聯法則; 矩陣; data mining; association rules; matrix
  • 描述: 由於資料庫日益龐大,要如何從這些大型資料庫中找出隱藏於其中的有用知識,已成為一種重要的研究課題。資料探勘正是由資料庫中探索知識的一項重要工程。不同於傳統的統計學分析,資料探勘是一種不需要事先預設前題的程序。而資料庫是由一筆筆的交易所構成的。其中,所謂的交易是由一些項目的記錄所集合而成的。關聯法則的探勘,已成為資料探勘工程當中的重要課題之一。舉例而言,在一個給定的交易記錄的資料庫當中,關聯法則探勘所要探討的問題就是存在於所有這些項目之間的關聯性,也就是說要找出當哪些項目出現之後,意味著還有哪幾個項目也會跟著同時出現在同樣的交易記錄當中。因此,在本論文中,我們提出新的探勘策略,稱之為矩陣法,利用資料庫中交易與項目之間的對應關係建立一個布林矩陣,再利用矩陣相乘的結果找出最大項目集合。從實驗的數據當中,在高密度、多筆數的資料庫上,矩陣法確實比Apriori具有更優越的效能表現。除此之外,我們也同時討論了將此兩種方法混合使用的可行性,以及由矩陣法切換至Apriori的最佳時機。
    As the rapid growth in the size and number of the database, the technology of discovering useful knowledge hidden in the large database has become an important research topic. Data mining is the important task of knowledge discovery in databases. Different from traditionally statistical analysis, data mining does not require any set up. Database is composed of many transactions. The transaction is the collection of several items. The mining of association rule has become one important technology of the data mining technology. For example, given a database of sales transactions, the problem of mining association rules is to discover all associations among items such that the presence of some items in a transaction will imply the presence of other items in the same transaction. Therefore, we proposed a new mining strategy, which is called matrix approach. The basic idea of the matrix approach is according to the relationship between the transactions and the items to build a Boolean matrix, and then apply the multiplication of matrixes to find the large itemsets. From the data of the experiment results, our matrix approach has the better performance than the Apriori in high density, great amount database. Besides, we discuss the feasibility of combining the two methods, and the optimal condition of transforming the matrix approach to the Apriori .
    碩士
  • 建立日期: 2000
  • 格式: 121 bytes
    text/html
  • 語言: 中文
  • 識別號: http://nutnr.lib.nutn.edu.tw/handle/987654321/4810
  • 資源來源: NUTN IR

正在檢索遠程資料庫,請稍等