Clusteringprofond avec auto-encodeurs convolutionnels
Files
Date
2023
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Clustering is a fundamental problem in many data-driven domains. The performance of clustering heavily relies on the quality of data representation. In recent years, numerous studies have focused on using deep neural networks to learn representations that enhance clustering and lead to significant improvements in clustering performance. In this study, we utilized a convolutional auto-encoder based neural network and the classical k-means clustering method to learn better data representations that facilitate clustering. To evaluate the results, we used the MNIST database, which contains handwritten digits, and measured the performance using the normalized mutual information (NMI) and the unsupervised clustering accuracy ACC and adjusted Rand index ARI. The obtained results demonstrate that classification based on the convolutional auto-encoder outperforms clustering performed with the classical k-means algorithm.
--------------------------------------------------------------------------------------
التجميع هو مشكلة أساسية في العديد من المجالات التي تعتمد على البيانات. يعتمد أداء التجميع بشكل كبير على جودة تمثيل البيانات. في السنوات الأخيرة، ركزت العديد من الدراسات على استخدام الشبكات العصبية العميقة لتعلم التمثيلات التي تعزز التجميع وتؤدي إلى تحسينات كبيرة في أداء التجميع. في هذه الدراسة، استخدمنا شبكة عصبية قائمة على التشفير التلقائي وطريقة تجميع الوسائل الكلاسيكيةk-means)(لتعلم تمثيلات بيانات أفضل تسهل التجميع. لتقييم النتائج، استخدمنا قاعدة بيانات MNIST ، التي تحتوي على أرقام مكتوبة بخط اليد ، وقمنا بقياس الأداء باستخدام مؤشر تقييم المعلومات المتبادلة (NMI)ودقة التجميع غير المشروفة ACCو مؤشر راند المعدلARI . توضح النتائج المتحصل عليها أن التصنيف المعتمد على المشفر التلقائي العميق يتفوق على التجميع المنفذ باستخدام خوارزمية الوسائل التقليدية (k-means).
--------------------------------------------------------------------------------------
Le clustering est un problème essentiel dans de nombreux domaines où les données sont prédominantes. Les performances de clustering dépendent fortement de la qualité de la représentation des données. Récemment, de nombreuses études se sont concentrées sur l'utilisation de réseaux de neurones profonds pour apprendre des représentations améliorant le regroupement et entraînant une amélioration significative des performances de clustering. Dans cette étude, nous avons utilisé un réseau neuronal à base d'auto-encodeur convolutionnel ainsi que la méthode classique de regroupement k-means pour apprendre de meilleures représentations de données qui facilitent le regroupement. Pour évaluer les résultats, nous avons utilisé la base de données MNIST, qui contient des chiffres manuscrite et mesuré les performances à l'aide de l'indice d'information mutuelle normalisée (NMI) et de l'exactitude du regroupement non supervisé ACC etl’indice Rand ajustéARI. Les résultats obtenus montrent que la classification basée sur l’auto-encodeur convolutif est plus performante que le regroupement réalisé avec l'algorithme classique k-means.