الانتقال الى المحتوى الأساسي
23-جمادى الآخرة-1447 هـ
جامعة الملك عبدالعزيز
KING ABDULAZIZ UNIVERSITY
كلية الحاسبات وتقنية المعلومات برابغ
تفاصيل الوثيقة
نوع الوثيقة
:
مقال في مجلة دورية
عنوان الوثيقة
:
خوارزمية التهيئة لمركز الكتلة لمجموعات تقسيم K-modes
Cluster center initialization algorithm for K-modes clustering
الموضوع
:
علوم الحاسبات
لغة الوثيقة
:
الانجليزية
المستخلص
:
Partitional clustering of categorical data is normally performed by using K-modes clustering algorithm, which works well for large datasets. Even though the design and implementation of K-modes algorithm is simple and efficient, it has the pitfall of randomly choosing the initial cluster centers for invoking every new execution that may lead to non-repeatable clustering results. This paper addresses the randomized center initialization problem of K-modes algorithm by proposing a cluster center initialization algorithm. The proposed algorithm performs multiple clustering of the data based on attribute values in different attributes and yields deterministic modes that are to be used as initial cluster centers. In the paper, we propose a new method for selecting the most relevant attributes, namely Prominent attributes, compare it with another existing method to find Significant attributes for unsupervised learning, and perform multiple clustering of data to find initial cluster centers. The proposed algorithm ensures fixed initial cluster centers and thus repeatable clustering results. The worst-case time complexity of the proposed algorithm is log-linear to the number of data objects. We evaluate the proposed algorithm on several categorical datasets and compared it against random initialization and two other initialization methods, and show that the proposed method performs better in terms of accuracy and time complexity. The initial cluster centers computed by the proposed approach are close to the actual cluster centers of the different data we tested, which leads to faster convergence of K-modes clustering algorithm in conjunction to better clustering results
ردمد
:
0957-4174
اسم الدورية
:
Expert Systems with Applications
المجلد
:
40
العدد
:
18
سنة النشر
:
1433 هـ
2012 م
نوع المقالة
:
مقالة علمية
تاريخ الاضافة على الموقع
:
Wednesday, November 6, 2013
الباحثون
اسم الباحث (عربي)
اسم الباحث (انجليزي)
نوع الباحث
المرتبة العلمية
البريد الالكتروني
أمير احمد
Ahmad, Amir
باحث
دكتوراه
amirahmad01@gmail.com
Shehroz Khan
Khan, Shehroz
باحث
الملفات
اسم الملف
النوع
الوصف
36341.pdf
pdf
الرجوع إلى صفحة الأبحاث