ABSTRACTThis thesis presents diagnose and detect faults of Tennessee Eastman Process (TEP) with machine learning algorithms via Poincaré plots-based feature extraction and statistically analysis-based feature selection. The IEEEDataPort online dataset, obtained from a big plant that contains nonlinear processes from various chemical units, is utilized in this thesis. It contains measures from 52 process points in TEP with 20 dissimilar malfunction types. In this study, raw dataset and dataset that applied feature extraction and feature selection was used. Poincaré plot was applied to the dataset for feature extraction so that four commonly used nonlinear features for every measurement point were calculated. After that, among these features, the features that show a statistically significant difference (alpha 0.05) between failure types were selected. The machine learning tools such as Decision Tree, Discriminant Analysis, Naive Bayes, k-Nearest Neighbors, Support Vector Machine, and Ensemble Learning algorithms were utilized to classify the fault types from both datasets. The maximum classifier accuracies were 89.5 for the whole feature dataset using the Subspace Discriminant Algorithm of the Ensemble Learning Classifier method and 93.5 for the selected features only using the Linear Discriminant Analysis during this study. These performances could be comprehendible among the results achieved in similar studies.ÖZETBu tez, Poincaré grafiğine dayalı öznitelik çıkarımı ve istatistiksel olarak analize dayalı öznitelik seçimi yoluyla makine öğrenme algoritmaları ile Tennessee Eastman Süreci (TEP) hatalarını teşhis ve tespit etmeyi sunar. Bu çalışmada, çeşitli kimyasal birimlerden doğrusal olmayan süreçleri içeren bir prosesten elde edilen IEEEDataPort çevrimiçi veri seti kullanılmıştır. 20 farklı arıza tipi ile TEP'de 52 proses noktasından alınan önlemleri içerir. Bu çalışmada, öznitelik çıkarımı ve öznitelik seçimi uygulanan ham veri seti ve veri seti kullanılmıştır. Her ölçüm noktası için yaygın olarak kullanılan dört doğrusal olmayan özellik hesaplanacak şekilde, özellik çıkarımı için veri kümesine Poincaré grafiği uygulandı. Daha sonra bu öznitelikler arasından hata türleri arasında istatistiksel olarak anlamlı fark (alfa 0.05) gösteren öznitelikler seçilmiştir. Her iki veri setinden de hata türlerini sınıflandırmak için Karar Ağacı, Diskriminant Analizi, Naive Bayes, k-En Yakın Komşular, Destek Vektör Makinesi ve Topluluk Learning algoritmaları gibi makine öğrenme araçları kullanılmıştır. Topluluk Learning Sınıflandırıcı yönteminin Altuzay Ayırım Algoritması kullanılarak tüm özellik veri kümesi için maksimum sınıflandırıcı doğruluğu 89,5 ve bu çalışma sırasında yalnızca Doğrusal Ayırım Analizi kullanılarak seçilen öznitelikler için 93,5 olmuştur. Bu performanslar, benzer çalışmalarda elde edilen sonuçlar arasında anlaşılabilir bir sonuç olabilir.
Eser Adı (dc.title) | Poincaré plot-based fault detection on tennessee eastman process using various machine learning algorithms Çeşitli makine öğrenimi algoritmalarını kullanarak tennessee eastman sürecinde poincaré grafik tabanlı hata tespiti |
Eser Sahibi (dc.contributor.author) | Çancıoğlu, Emre |
Tez Danışmanı (dc.contributor.advisor) | Savaş Şahin |
Yayıncı (dc.publisher) | Graduate School of Natural and Applied Sciences |
Tür (dc.type) | Yüksek Lisans |
Açıklama (dc.description) | xii, 56 pages |
Açıklama (dc.description) | 29 cm. 1 CD |
Özet (dc.description.abstract) | ABSTRACTThis thesis presents diagnose and detect faults of Tennessee Eastman Process (TEP) with machine learning algorithms via Poincaré plots-based feature extraction and statistically analysis-based feature selection. The IEEEDataPort online dataset, obtained from a big plant that contains nonlinear processes from various chemical units, is utilized in this thesis. It contains measures from 52 process points in TEP with 20 dissimilar malfunction types. In this study, raw dataset and dataset that applied feature extraction and feature selection was used. Poincaré plot was applied to the dataset for feature extraction so that four commonly used nonlinear features for every measurement point were calculated. After that, among these features, the features that show a statistically significant difference (alpha 0.05) between failure types were selected. The machine learning tools such as Decision Tree, Discriminant Analysis, Naive Bayes, k-Nearest Neighbors, Support Vector Machine, and Ensemble Learning algorithms were utilized to classify the fault types from both datasets. The maximum classifier accuracies were 89.5 for the whole feature dataset using the Subspace Discriminant Algorithm of the Ensemble Learning Classifier method and 93.5 for the selected features only using the Linear Discriminant Analysis during this study. These performances could be comprehendible among the results achieved in similar studies.ÖZETBu tez, Poincaré grafiğine dayalı öznitelik çıkarımı ve istatistiksel olarak analize dayalı öznitelik seçimi yoluyla makine öğrenme algoritmaları ile Tennessee Eastman Süreci (TEP) hatalarını teşhis ve tespit etmeyi sunar. Bu çalışmada, çeşitli kimyasal birimlerden doğrusal olmayan süreçleri içeren bir prosesten elde edilen IEEEDataPort çevrimiçi veri seti kullanılmıştır. 20 farklı arıza tipi ile TEP'de 52 proses noktasından alınan önlemleri içerir. Bu çalışmada, öznitelik çıkarımı ve öznitelik seçimi uygulanan ham veri seti ve veri seti kullanılmıştır. Her ölçüm noktası için yaygın olarak kullanılan dört doğrusal olmayan özellik hesaplanacak şekilde, özellik çıkarımı için veri kümesine Poincaré grafiği uygulandı. Daha sonra bu öznitelikler arasından hata türleri arasında istatistiksel olarak anlamlı fark (alfa 0.05) gösteren öznitelikler seçilmiştir. Her iki veri setinden de hata türlerini sınıflandırmak için Karar Ağacı, Diskriminant Analizi, Naive Bayes, k-En Yakın Komşular, Destek Vektör Makinesi ve Topluluk Learning algoritmaları gibi makine öğrenme araçları kullanılmıştır. Topluluk Learning Sınıflandırıcı yönteminin Altuzay Ayırım Algoritması kullanılarak tüm özellik veri kümesi için maksimum sınıflandırıcı doğruluğu 89,5 ve bu çalışma sırasında yalnızca Doğrusal Ayırım Analizi kullanılarak seçilen öznitelikler için 93,5 olmuştur. Bu performanslar, benzer çalışmalarda elde edilen sonuçlar arasında anlaşılabilir bir sonuç olabilir. |
Kayıt Giriş Tarihi (dc.date.accessioned) | 03.11.2022 |
Açık Erişim Tarihi (dc.date.available) | 2022-11-03 |
Yayın Tarihi (dc.date.issued) | 2022 |
Yayın Dili (dc.language.iso) | eng |
Konu Başlıkları (dc.subject) | Elektrik ve Elektronik Mühendisliği |
Konu Başlıkları (dc.subject) | Electrical and Electronics Engineering |
Tek Biçim Adres (dc.identifier.uri) | https://hdl.handle.net/11469/3001 |