Yayın: Automatic Ship Detection and Classification using Machine Learning from Remote Sensing Images on Apache Spark
| dc.contributor.author | Dolapci, Betül | |
| dc.contributor.author | Özcan, Caner | |
| dc.date.accessioned | 2026-01-04T15:45:48Z | |
| dc.date.issued | 2021-09-15 | |
| dc.description.abstract | Ship detection and classification is very important for port and coastal security. Due to maritime safety and traffic control, high-resolution images of ships should be obtained. High resolution color remote sensing ship images taken from short distances provide advantages in ship detection applications. But the analysis of these high-dimensional images is complicated and requires long time. Dividing the image data into smaller blocks and representing them with a vector with distinctive and independent features facilitates the analysis process. For this reason, a block division method is applied first, dividing the image data into small pixel blocks. These obtained image blocks are also represented by the hybrid feature vectors. These feature vectors are created by adding the sub-features extracted from the color and texture properties of the images one after another. Using the obtained hybrid vectors, the images are classified using machine learning methods on Apache Spark. Classification studies were realized using Naive Bayes, Decision Trees and Random Forest methods in the MLlib. The analysis of the images was realized much faster with the clustering architecture created on Apache Spark platform. According to the obtained classification results, 99.62% classification success was achieved by using Random Forest method. In addition, an average of 3.4 times acceleration was achieved by running each method on 1 master + 4 workers clustering architecture on Spark. The analysis results obtained are presented in detail in the experimental studies section. | |
| dc.description.abstract | Gemi tespiti ve sınıflandırması, liman ve kıyı güvenliği açısından çok önemlidir. Deniz güvenliği ve trafik kontrolü nedeniyle, gemilerin yüksek çözünürlüklü görüntülerinin elde edilmesi gerekmektedir. Kısa mesafeden çekilmiş yüksek çözünürlüklü renkli uzaktan algılama gemi görüntüleri, gemi tespiti uygulamalarında avantaj sağlamaktadır. Fakat yüksek boyutlu bu görüntülerin analiz edilmesi süreci karmaşık ve uzun süreler gerektirmektedir. Görüntü verilerinin daha küçük parçalara bölünmesi ve bu parçalardan elde edilen ayırt edici ve bağımsız özelliklere sahip bir vektörle temsil edilmesi analiz işlemini kolaylaştırmaktadır. Bu nedenle, öncelikle görüntü verilerini küçük piksel bloklarına bölen bir blok bölümü yöntemi uygulanır. Elde edilen bu görüntü bloklarının da hibrit bir öznitelik vektörleri ile temsil edilmesi gerçekleştirilir. Bu öznitelik vektörleri, görüntülerin renk ve doku özelliklerinden çıkarılan alt özelliklerin birbiri ardına eklenmesi ile oluşturulur. Elde edilen hibrit vektörler Apache Spark'daki makine öğrenmesi yöntemleri ile kullanılarak görüntülerin sınıflandırılması sağlanmıştır. MLlib kütüphanesinde bulunan Naif Bayes, Karar Ağaçları ve Rastgele Orman yöntemleri kullanılarak sınıflandırma çalışmaları gerçekleştirilmiştir. Görüntülerin Apache Spark ortamında analiz edilmesi oluşturulan kümeleme mimarisi ile çok daha hızlı bir şekilde gerçekleştirilmiştir. Ayrıca her bir yöntemin Spark 1 master + 4 worker kümeleme mimarisi üzerinde çalıştırılması sonucu ortalama 3.4 kata yakın hızlanma sağlanmıştır. | |
| dc.description.uri | https://doi.org/10.38016/jista.772145 | |
| dc.description.uri | https://dergipark.org.tr/en/download/article-file/1210735 | |
| dc.description.uri | https://dx.doi.org/10.38016/jista.772145 | |
| dc.description.uri | https://dergipark.org.tr/tr/pub/jista/issue/61285/772145 | |
| dc.identifier.doi | 10.38016/jista.772145 | |
| dc.identifier.eissn | 2651-3927 | |
| dc.identifier.endpage | 102 | |
| dc.identifier.openaire | doi_dedup___::b312b10a57a93cbbd0e3f310921a2a4d | |
| dc.identifier.orcid | 0000-0002-2854-4005 | |
| dc.identifier.startpage | 94 | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12597/39042 | |
| dc.publisher | Journal of Intelligent Systems: Theory and Applications, Harun TASKIN | |
| dc.relation.ispartof | Journal of Intelligent Systems: Theory and Applications | |
| dc.rights | OPEN | |
| dc.subject | Yapay Zeka | |
| dc.subject | Apache Spark | |
| dc.subject | Sınıflandırma | |
| dc.subject | Kümeleme | |
| dc.subject | Makine Öğrenmesi | |
| dc.subject | Uzaktan Algılama | |
| dc.subject | Gemi Tespiti | |
| dc.subject | Artificial Intelligence | |
| dc.subject | Apache Spark | |
| dc.subject | Classification | |
| dc.subject | Clustering | |
| dc.subject | Machine Learning | |
| dc.subject | Remote Sensing | |
| dc.subject | Ship Detection | |
| dc.subject.sdg | 4. Education | |
| dc.subject.sdg | 14. Life underwater | |
| dc.subject.sdg | 15. Life on land | |
| dc.title | Automatic Ship Detection and Classification using Machine Learning from Remote Sensing Images on Apache Spark | |
| dc.type | Article | |
| dspace.entity.type | Publication | |
| local.api.response | {"authors":[{"fullName":"DOLAPCI, Betül","name":"Betül","surname":"Dolapci","rank":1,"pid":null},{"fullName":"ÖZCAN, Caner","name":"Caner","surname":"Özcan","rank":2,"pid":{"id":{"scheme":"orcid","value":"0000-0002-2854-4005"},"provenance":null}}],"openAccessColor":"gold","publiclyFunded":false,"type":"publication","language":{"code":"und","label":"Undetermined"},"countries":null,"subjects":[{"subject":{"scheme":"FOS","value":"0301 basic medicine"},"provenance":null},{"subject":{"scheme":"FOS","value":"0303 health sciences"},"provenance":null},{"subject":{"scheme":"FOS","value":"03 medical and health sciences"},"provenance":null},{"subject":{"scheme":"keyword","value":"Yapay Zeka"},"provenance":null},{"subject":{"scheme":"keyword","value":"Apache Spark;Sınıflandırma;Kümeleme;Makine Öğrenmesi;Uzaktan Algılama;Gemi Tespiti"},"provenance":null},{"subject":{"scheme":"keyword","value":"Artificial Intelligence"},"provenance":null},{"subject":{"scheme":"SDG","value":"4. Education"},"provenance":null},{"subject":{"scheme":"FOS","value":"0401 agriculture, forestry, and fisheries"},"provenance":null},{"subject":{"scheme":"keyword","value":"Apache Spark;Classification;Clustering;Machine Learning;Remote Sensing;Ship Detection"},"provenance":null},{"subject":{"scheme":"FOS","value":"04 agricultural and veterinary sciences"},"provenance":null},{"subject":{"scheme":"SDG","value":"14. Life underwater"},"provenance":null},{"subject":{"scheme":"SDG","value":"15. Life on land"},"provenance":null}],"mainTitle":"Automatic Ship Detection and Classification using Machine Learning from Remote Sensing Images on Apache Spark","subTitle":null,"descriptions":["Ship detection and classification is very important for port and coastal security. Due to maritime safety and traffic control, high-resolution images of ships should be obtained. High resolution color remote sensing ship images taken from short distances provide advantages in ship detection applications. But the analysis of these high-dimensional images is complicated and requires long time. Dividing the image data into smaller blocks and representing them with a vector with distinctive and independent features facilitates the analysis process. For this reason, a block division method is applied first, dividing the image data into small pixel blocks. These obtained image blocks are also represented by the hybrid feature vectors. These feature vectors are created by adding the sub-features extracted from the color and texture properties of the images one after another. Using the obtained hybrid vectors, the images are classified using machine learning methods on Apache Spark. Classification studies were realized using Naive Bayes, Decision Trees and Random Forest methods in the MLlib. The analysis of the images was realized much faster with the clustering architecture created on Apache Spark platform. According to the obtained classification results, 99.62% classification success was achieved by using Random Forest method. In addition, an average of 3.4 times acceleration was achieved by running each method on 1 master + 4 workers clustering architecture on Spark. The analysis results obtained are presented in detail in the experimental studies section.","Gemi tespiti ve sınıflandırması, liman ve kıyı güvenliği açısından çok önemlidir. Deniz güvenliği ve trafik kontrolü nedeniyle, gemilerin yüksek çözünürlüklü görüntülerinin elde edilmesi gerekmektedir. Kısa mesafeden çekilmiş yüksek çözünürlüklü renkli uzaktan algılama gemi görüntüleri, gemi tespiti uygulamalarında avantaj sağlamaktadır. Fakat yüksek boyutlu bu görüntülerin analiz edilmesi süreci karmaşık ve uzun süreler gerektirmektedir. Görüntü verilerinin daha küçük parçalara bölünmesi ve bu parçalardan elde edilen ayırt edici ve bağımsız özelliklere sahip bir vektörle temsil edilmesi analiz işlemini kolaylaştırmaktadır. Bu nedenle, öncelikle görüntü verilerini küçük piksel bloklarına bölen bir blok bölümü yöntemi uygulanır. Elde edilen bu görüntü bloklarının da hibrit bir öznitelik vektörleri ile temsil edilmesi gerçekleştirilir. Bu öznitelik vektörleri, görüntülerin renk ve doku özelliklerinden çıkarılan alt özelliklerin birbiri ardına eklenmesi ile oluşturulur. Elde edilen hibrit vektörler Apache Spark'daki makine öğrenmesi yöntemleri ile kullanılarak görüntülerin sınıflandırılması sağlanmıştır. MLlib kütüphanesinde bulunan Naif Bayes, Karar Ağaçları ve Rastgele Orman yöntemleri kullanılarak sınıflandırma çalışmaları gerçekleştirilmiştir. Görüntülerin Apache Spark ortamında analiz edilmesi oluşturulan kümeleme mimarisi ile çok daha hızlı bir şekilde gerçekleştirilmiştir. Ayrıca her bir yöntemin Spark 1 master + 4 worker kümeleme mimarisi üzerinde çalıştırılması sonucu ortalama 3.4 kata yakın hızlanma sağlanmıştır."],"publicationDate":"2021-09-15","publisher":"Journal of Intelligent Systems: Theory and Applications, Harun TASKIN","embargoEndDate":null,"sources":["Crossref","Volume: 4, Issue: 2 94-102","2651-3927","Journal of Intelligent Systems: Theory and Applications","Zeki Sistemler Teori ve Uygulamaları Dergisi"],"formats":["application/pdf"],"contributors":null,"coverages":null,"bestAccessRight":{"code":"c_abf2","label":"OPEN","scheme":"http://vocabularies.coar-repositories.org/documentation/access_rights/"},"container":{"name":"Journal of Intelligent Systems: Theory and Applications","issnPrinted":null,"issnOnline":"2651-3927","issnLinking":null,"ep":"102","iss":null,"sp":"94","vol":null,"edition":null,"conferencePlace":null,"conferenceDate":null},"documentationUrls":null,"codeRepositoryUrl":null,"programmingLanguage":null,"contactPeople":null,"contactGroups":null,"tools":null,"size":null,"version":null,"geoLocations":null,"id":"doi_dedup___::b312b10a57a93cbbd0e3f310921a2a4d","originalIds":["10.38016/jista.772145","50|doiboost____|b312b10a57a93cbbd0e3f310921a2a4d","3153573683","50|tubitakulakb::1af4ba1076237d532acc6bac6c51c17c","oai:dergipark.org.tr:article/772145"],"pids":[{"scheme":"doi","value":"10.38016/jista.772145"}],"dateOfCollection":null,"lastUpdateTimeStamp":null,"indicators":{"citationImpact":{"citationCount":6,"influence":3.0839924e-9,"popularity":6.505624e-9,"impulse":6,"citationClass":"C5","influenceClass":"C5","impulseClass":"C4","popularityClass":"C4"}},"instances":[{"pids":[{"scheme":"doi","value":"10.38016/jista.772145"}],"type":"Article","urls":["https://doi.org/10.38016/jista.772145"],"publicationDate":"2021-09-15","refereed":"peerReviewed"},{"pids":[{"scheme":"doi","value":"10.38016/jista.772145"}],"type":"Article","urls":["https://dergipark.org.tr/en/download/article-file/1210735"],"refereed":"nonPeerReviewed"},{"alternateIdentifiers":[{"scheme":"mag_id","value":"3153573683"},{"scheme":"doi","value":"10.38016/jista.772145"}],"type":"Other literature type","urls":["https://dx.doi.org/10.38016/jista.772145"],"refereed":"nonPeerReviewed"},{"alternateIdentifiers":[{"scheme":"doi","value":"10.38016/jista.772145"}],"type":"Article","urls":["https://dergipark.org.tr/tr/pub/jista/issue/61285/772145"],"publicationDate":"2020-07-21","refereed":"nonPeerReviewed"}],"isGreen":false,"isInDiamondJournal":false} | |
| local.import.source | OpenAire |
