Yayın:
Comparing The Effect of Under-Sampling and Over-Sampling on Traditional Machine Learning Algorithms for Epileptic Seizure Detection

dc.contributor.authorAkyol, Kemal
dc.contributor.authorAti̇la, Ümi̇t
dc.date.accessioned2026-01-04T12:52:16Z
dc.date.issued2019-05-23
dc.description.abstractTekrarlayanve ani krizlere neden olan nörolojik bir hastalık olan epilepsy hastalığıöngörülemeyen zamanlarda ortaya çıkar. Bu çalışma, epileptik nöbet tahmini içinelektroensefalogram sinyallerinin sınıflandırılmasını sunmaktadır. Makineöğrenme algoritmalarının performansı, elektroensefalogram sinyallerinden eldeedilen veriseti üzerinde değerlendirilmiştir. Veriseti, 23.5 saniye boyunca4097 veri noktasına sahip 500 örnek içermektedir. Veriseti dengesiz olduğuiçin, bu veri setinde Rastgele Alt Örnekleme ve Rastgele Üst Örneklemeyöntemleri uygulanmıştır. Bu nedenle bu çalışma üç veri seti üzerindeyürütülmüştür. Her veri seti üç senaryo çerçevesinde % 60 eğitim - % 40 test, %70 eğitim - % 30 test ve % 80 eğitim - % 20 test verileri olarak ayrılmıştır. Buverisetleri üzerinde Çapraz Doğrusal Ayırt Edici Analiz, Doğrusal Ayırt EdiciAnaliz, Lojistik Regresyon ve Rastgele Orman makine öğrenmesi algoritmalarınperformansları değerlendirilmiş ve tartışılmıştır. Genel sonuçlar, tümverisetleri için Random Forest algoritmasının doğruluk, hassasiyet ve özgüllük metrikleriaçısından üstün olduğunu göstermiştir.
dc.description.abstractEpilepsy disease, a neurological disorder that causesrecurrent and sudden crises, occurs at unforeseen times. This study presentsthe classification of electroencephalogram signals for epileptic seizureprediction. The performances of the machine learning algorithms are evaluatedon the dataset extracted from electroencephalogram signals. The datasetconsists of 500 instances which have 4097 data points for 23.5 seconds. Sincethe dataset unbalanced, Random Under Sampling and Random Over Sampling methodsare performed on this dataset. Therefore, this study is conducted on threedatasets. Each dataset is split to 60% train - 40% test, 70% train - 30% testand 80% train - 20% test within the three scenarios. The performances ofDiagonal Linear Discriminant Analysis, Linear Discriminant Analysis, LogisticRegression and Random Forest machine learning algorithms on these datasets areassessed, and discussed. The overall results show that Random Forest is thesuperior algorithm for all datasets in terms of accuracy, sensitivity and specificitymetrics.
dc.description.urihttps://avesis.gazi.edu.tr/publication/details/5a5a3d71-e619-43cf-ae5f-374bb0edf273/oai
dc.description.urihttps://dergipark.org.tr/tr/pub/apjes/issue/52467/569553
dc.identifier.openairededup_wf_002::9beaee0183a40e3d3f5acd92793d367b
dc.identifier.urihttps://hdl.handle.net/20.500.12597/37345
dc.language.isotur
dc.publisherAkademik Perspektif Derneği
dc.rightsCLOSED
dc.subjectEpileptic seizure
dc.subjectmachine learning
dc.subjectunbalanced and balanced dataset
dc.subjectover sampling
dc.subjectunder sampling.
dc.subjectEngineering
dc.subjectEpileptik nöbet
dc.subjectmakine öğrenmesi
dc.subjectdengesiz ve dengeli veri seti
dc.subjectüst örnekleme
dc.subjectalt örnekleme.
dc.subjectMühendislik
dc.titleComparing The Effect of Under-Sampling and Over-Sampling on Traditional Machine Learning Algorithms for Epileptic Seizure Detection
dc.typeArticle
dspace.entity.typePublication
local.api.response{"authors":[{"fullName":"AKYOL, Kemal","name":"Kemal","surname":"Akyol","rank":1,"pid":null},{"fullName":"ATİLA, ÜMİT","name":"Ümi̇t","surname":"Ati̇la","rank":2,"pid":null}],"openAccessColor":null,"publiclyFunded":null,"type":"publication","language":{"code":"tur","label":"Turkish"},"countries":null,"subjects":[{"subject":{"scheme":"keyword","value":"Epileptic seizure;machine learning;unbalanced and balanced dataset;over sampling;under sampling."},"provenance":null},{"subject":{"scheme":"keyword","value":"Engineering"},"provenance":null},{"subject":{"scheme":"keyword","value":"Epileptik nöbet;makine öğrenmesi;dengesiz ve dengeli veri seti;üst örnekleme;alt örnekleme."},"provenance":null},{"subject":{"scheme":"keyword","value":"Mühendislik"},"provenance":null}],"mainTitle":"Comparing The Effect of Under-Sampling and Over-Sampling on Traditional Machine Learning Algorithms for Epileptic Seizure Detection","subTitle":null,"descriptions":["Tekrarlayanve ani krizlere neden olan nörolojik bir hastalık olan epilepsy hastalığıöngörülemeyen zamanlarda ortaya çıkar. Bu çalışma, epileptik nöbet tahmini içinelektroensefalogram sinyallerinin sınıflandırılmasını sunmaktadır. Makineöğrenme algoritmalarının performansı, elektroensefalogram sinyallerinden eldeedilen veriseti üzerinde değerlendirilmiştir. Veriseti, 23.5 saniye boyunca4097 veri noktasına sahip 500 örnek içermektedir. Veriseti dengesiz olduğuiçin, bu veri setinde Rastgele Alt Örnekleme ve Rastgele Üst Örneklemeyöntemleri uygulanmıştır. Bu nedenle bu çalışma üç veri seti üzerindeyürütülmüştür. Her veri seti üç senaryo çerçevesinde % 60 eğitim - % 40 test, %70 eğitim - % 30 test ve % 80 eğitim - % 20 test verileri olarak ayrılmıştır. Buverisetleri üzerinde Çapraz Doğrusal Ayırt Edici Analiz, Doğrusal Ayırt EdiciAnaliz, Lojistik Regresyon ve Rastgele Orman makine öğrenmesi algoritmalarınperformansları değerlendirilmiş ve tartışılmıştır. Genel sonuçlar, tümverisetleri için Random Forest algoritmasının doğruluk, hassasiyet ve özgüllük metrikleriaçısından üstün olduğunu göstermiştir.","Epilepsy disease, a neurological disorder that causesrecurrent and sudden crises, occurs at unforeseen times. This study presentsthe classification of electroencephalogram signals for epileptic seizureprediction. The performances of the machine learning algorithms are evaluatedon the dataset extracted from electroencephalogram signals. The datasetconsists of 500 instances which have 4097 data points for 23.5 seconds. Sincethe dataset unbalanced, Random Under Sampling and Random Over Sampling methodsare performed on this dataset. Therefore, this study is conducted on threedatasets. Each dataset is split to 60% train - 40% test, 70% train - 30% testand 80% train - 20% test within the three scenarios. The performances ofDiagonal Linear Discriminant Analysis, Linear Discriminant Analysis, LogisticRegression and Random Forest machine learning algorithms on these datasets areassessed, and discussed. The overall results show that Random Forest is thesuperior algorithm for all datasets in terms of accuracy, sensitivity and specificitymetrics."],"publicationDate":"2019-05-23","publisher":"Akademik Perspektif Derneği","embargoEndDate":null,"sources":["Volume: 8, Issue: 2 279-285","2147-4575","Akademik Platform Mühendislik ve Fen Bilimleri Dergisi","Academic Platform - Journal of Engineering and Science"],"formats":["application/pdf"],"contributors":null,"coverages":null,"bestAccessRight":{"code":"c_14cb","label":"CLOSED","scheme":"http://vocabularies.coar-repositories.org/documentation/access_rights/"},"container":null,"documentationUrls":null,"codeRepositoryUrl":null,"programmingLanguage":null,"contactPeople":null,"contactGroups":null,"tools":null,"size":null,"version":null,"geoLocations":null,"id":"dedup_wf_002::9beaee0183a40e3d3f5acd92793d367b","originalIds":["50|od_____10046::8294171195ba705811184edd7b0f67a5","5a5a3d71-e619-43cf-ae5f-374bb0edf273","oai:dergipark.org.tr:article/569553","50|tubitakulakb::2db22480aaad7cd68530df1c7fb6a3c3"],"pids":null,"dateOfCollection":null,"lastUpdateTimeStamp":null,"indicators":{"citationImpact":{"citationCount":0,"influence":2.5349236e-9,"popularity":1.2286145e-9,"impulse":0,"citationClass":"C5","influenceClass":"C5","impulseClass":"C5","popularityClass":"C5"}},"instances":[{"alternateIdentifiers":[{"scheme":"doi","value":"10.21541/apjes.569553"}],"type":"Article","urls":["https://avesis.gazi.edu.tr/publication/details/5a5a3d71-e619-43cf-ae5f-374bb0edf273/oai"],"publicationDate":"2020-05-01","refereed":"nonPeerReviewed"},{"alternateIdentifiers":[{"scheme":"doi","value":"10.21541/apjes.569553"}],"type":"Article","urls":["https://dergipark.org.tr/tr/pub/apjes/issue/52467/569553"],"publicationDate":"2019-05-23","refereed":"nonPeerReviewed"}],"isGreen":null,"isInDiamondJournal":null}
local.import.sourceOpenAire

Dosyalar

Koleksiyonlar