skip to main content
資源種類 顯示結果: 顯示結果: 查詢種類 索引

在動態交易資料庫中探勘線上關聯法則之設計與分析

陳可欣; Chen, Kohsin 李建億; 資訊教育研究所 2001

線上取得

  • 題名:
    在動態交易資料庫中探勘線上關聯法則之設計與分析
  • 著者: 陳可欣; Chen, Kohsin
  • 李建億; 資訊教育研究所
  • 主題: 資料探勘; 關聯法則; 線上關聯法則; data mining; association rule; online association rule
  • 描述: 由於資料庫應用範圍與所處理資料量的與日俱增,要如何從這些資料中找出有用訊息,便成為一個重要的研究領域。資料探勘,正是由資料庫中探勘知識,找出使用者感興趣資訊的重要技術。關聯法則為資料探勘研究領域之一,主要是發掘出交易資料庫中所包含的項目之間所隱含之關聯性。在關聯法則資料探勘的應用上,大部份的演算法都只能運用於靜態的資料庫,但有些應用必須在動態資料庫上挖掘出即時的關聯法則,為了提供這樣的功能,於是有了線上關聯法則資料探勘的發展與研究。而目前所提出的線上關聯法則演算法所採取的作法,有些是將資料庫裡的資料直接載入記憶體中,讓使用者進行線上挖掘,但受限於記憶體的容量會造成探勘結果不完整,或是在使用者進行線上探勘前必須事先產生相關資料於記憶體中,然而,使用者必須等待一段時間才能進行線上關聯法則探勘。於是,本論文提出了一個更有效率的線上關聯法則,稱之為OLDIC ( OnLine Dynamic Counting ) 演算法,主要作法是利用使用者設定的需求,分段掃瞄資料庫產生所需資訊,儲存並且重複利用已經產生的資訊,提高演算法的執行效率。除此之外,OLDIC演算法可以提供線上關聯法則的探勘、線上動態資料庫關聯法則的探勘和線上動態最小支持度的關聯法則探勘。因此,OLDIC演算法不但不受限於記憶體的容量,也可以在線上完成所有的執行過程,並且提供動態資料庫和動態最小支持度的關聯法則探勘功能。再者,因為項目集在探勘過程中具有生命週期的特性,在資料庫或最小支持度經常變動的情況下,可以減少掃瞄資料庫的執行時間,提高演算法的效率。從實驗的數據中,也可以發現在面對資料量大的資料庫時,OLDIC演算法依然有很高的執行效率。
    As the rapid growth in the size and number of the database, the technology of discovering useful knowledge hidden in the large database has become an important research topic. Data mining is the important task of knowledge discovery in databases. The mining of association rule has become one important technology of the data mining technology. Most algorithms for finding associations rules only apply to a static database. However, some applications require generating association rules in real-time from a dynamic database. Therefore, there proposes an online data mining requirement. Some existing online mining algorithms directly record the data in main memory. Some of them and could generate some incomplete mining result. The others need to generate some information offline, and users must wait a long time to a re-mining process. Therefore, we will propose a new online mining strategy, which is called OLDIC ( OnLine Dynamic Counting ) approach. The basic idea of the OLDIC approach divides database into some predetermined parts, and then, it scans each part to obtain and store some information we need, and make use of these information effectively. Besides, the OLDIC approach supports provider users with online association rule mining, where the users are free to change the support threshold or update database at any time. Therefore, the OLDIC approach not only reduces memory size but also supports online association rule mining. The OLDIC approach has a good performance by reducing the number of scanning database, even for variant lift cycle of itemsets, dynamic database, or changeful support threshold. According to the simulation results, the influence of the performance of the OLDIC approach on the size of the database is not obvious.
    碩士
  • 建立日期: 2001
  • 格式: 121 bytes
    text/html
  • 語言: 中文
  • 識別號: http://nutnr.lib.nutn.edu.tw/handle/987654321/4854
  • 資源來源: NUTN IR

正在檢索遠程資料庫,請稍等