FGVC-Pesawat
Fine-Grained Visual Classification of Aircraft (FGVC-Aircraft) adalah dataset patokan untuk kategorisasi visual berbutir halus dari pesawat.Data, anotasi, dan kode evaluasi [2,75 GB | Jumlah MD5].Anotasi dan kode evaluasi saja [375 KB | Jumlah MD5].Halaman beranda proyek.Data ini digunakan sebagai bagian dari tantangan pengakuan berbutir halusFGComp 2013 yang berjalan sesuai dengan ImageNet Challenge 2013 (hasil). Harap dicatat bahwa kode evaluasi yang diberikan di sini mungkin berbeda dari yang digunakan dalam tantangan.
Silakan gunakan kutipan berikut saat merujuk ke himpunan data ini:
Klasifikasi Visual Berbutir Halus Pesawat Terbang, S. Maji, J. Kannala, E. Rahtu, M. Blaschko, A. Vedaldi, arXiv.org, 2013@techreport{maji13fine-grained,title= {Fine-Grained Visual Classification of Aircraft},author= {S. Maji and J. Kannala and E. Rahtuand M. Blaschko and A. Vedaldi},year= {2013},archivePrefix = {arXiv},eprint= {1306.5151},primaryClass= "cs-cv",}
Untuk informasi lebih lanjut lihat:Mulai cepatTentang pesawatFormat data dan anotasiEvaluasiMetrik evaluasiKode evaluasiAckwonledgmentsCatatan rilis
Nota. Data ini telah digunakan sebagai bagian dari ImageNet FGVCchallenge dalam konjuksi dengan Konferensi Internasional tentang ComputerVision (ICCV) 2013. Label uji coba tidak tersedia sampai akhir tahun karena kebijakan tantangan ImageNet. Mereka sekarang telah dirilis sebagai bagian dari unduhan di atas. Jika Anda mengunduh arsip theiamge dan ingin memiliki akses ke label uji, cukup unduh arsip anotasi lagi.
Nota. Gambar dalam tolok ukur dengan murah hati tersedia untuk tujuan penelitian non-komersial hanya oleh sejumlah pesawat terbang. Harap dicatat bahwa penulis asli mempertahankan hak cipta dari foto masing-masing dan harus dihubungi untuk tujuan lain. Untuk detail lebih lanjut lihat catatan hak cipta di bawah ini.
Dataset berisi 10.200 gambar pesawat, dengan 100 gambar foreach dari 102 varian model pesawat yang berbeda, yang sebagian besar adalah pesawat terbang. Pesawat (utama) di setiap gambar diberi anotasi dengan kotak ketat dan label model pesawat hierarkis.
Model pesawat diatur dalam hierarki empat tingkat. Empat tingkatan, dari yang lebih halus hingga lebih kasar, adalah:Model, misalnya Boeing 737-76J. Karena model tertentu hampir secara visualindistinguishable, tingkat ini tidak digunakan dalam evaluasi.Varian, misalnya Boeing 737-700. Sebuah varian meruntuhkan semua model yang secara visual tidak dapat dibedakan menjadi satu kelas. Thedataset terdiri dari 102 varian yang berbeda.Keluarga, misalnya Boeing 737. Dataset terdiri dari 70families yang berbeda.Produsen, misalnya Boeing. Dataset ini terdiri dari 41 produsen yang berbeda.
Data dibagi menjadi tiga pelatihan berukuran sama, validasi dan subset uji. Dua set pertama dapat digunakan untuk pengembangan, dan yang terakhir harus digunakan untuk evaluasi akhir saja. Format data dijelaskan selanjutnya.
Kinerja algoritma klasifikasi berbutir halus dievaluasi dalam hal akurasi prediksi kelas rata-rata. Ini didefinisikan sebagai rata-rata diagonal confusionmatrix yang dinormalisasi baris, seperti yang digunakan misalnya di Caltech-101. Tiga klasifikasi yang dipertimbangkan: varian, keluarga, dan produsen. Skrip evaluasi di MATLAB disediakan. Tentang pesawat
Pesawat terbang, dan khususnya pesawat terbang, adalah alternatif untuk objek yang secara tidak sengaja dipertimbangkan untuk kategorisasi berbutir halus seperti burung dan burung. Ada beberapa aspek yang membuat pengenalan model pesawat menjadi menarik. Pertama, desain pesawat mencakup seratus tahun, termasuk ribuan model yang berbeda dan ratusan merek dan maskapai penerbangan yang berbeda. Kedua, desain pesawat bervariasi tergantung pada ukuran (dari rumah-dibangun untuk largecarriers), tujuan (swasta, sipil, militer), tujuan (transporter, kapal induk, pelatihan, olahraga, pesawat tempur, dll), propulsi (glider, baling-baling, jet), dan banyak faktor lainnya termasuk teknologi. Salah satu sumbu variasi tertentu, yang tidak dibagi dengan kategori seperti hewan, adalah kenyataan bahwa struktur pesawat berubah dengan desain mereka (jumlah sayap, undercarriages, roda per undercarriage, mesin, dll.). Ketiga, model pesawat anygiven dapat dirancang ulang atau digunakan oleh berbagai pihak, yang menyebabkan variasi lebih lanjut dalam penampilan (livery). Ini, tergantung pada tugas identifikasi, dapat dianggap sebagai kebisingan atau sebagai informasi yang berguna untuk diekstraksi. Akhirnya, pesawat adalah objek yang sebagian besar kaku, yang menyederhanakan aspek-aspek tertentu dari model mereka (dibandingkan dengan hewan yang sangat cacat seperti kucing), memungkinkan seseorang untuk fokus pada aspek inti dari masalah rekognisi berbutir halus.
Data direktori berisi gambar serta sejumlah file teks dengan anotasi data.
Gambar terkandung dalam sub-direktori data/gambar. Mereka dalam format INJPEG dan memiliki nama yang terdiri dari tujuh digit dan .jpgsuffix (misalnya data/images/1187707.jpg). Resolusi gambar adalah sekitar 1-2MP. Setiap gambar memiliki di bagian bawah spanduk setinggi 20 piksel yang berisi informasi. Pastikan untuk menghapus spanduk ini ketika menggunakan gambar untuk melatih dan mengevaluasi algoritma.
Anotasi datang dalam sejumlah file teks. Setiap baris dari file ini berisi nama gambar opsional diikuti oleh imageannotation, baik label tekstual atau urutan angka.
data/images_train.txt berisi daftar gambar pelatihan:0787226148109115488990674300...
File serupa data / images_val.txt dan data / images_test.txt berisi validasi listof dan gambar uji.
data/images_variant_train.txt, data/images_family_train.txt, dan data/images_manufacturer_train.txt berisi daftar gambar pelatihan yang dianotasi dengan varian model, keluarga, dan nama produsen masing-masing:0787226 Balon Bebas Bola Abingdon1481091 AEG Wagner Eule1548899 Aeris Naviter AN-2 Enara0674300 Aeritalia F-104S Starfighter...
File serupa disediakan untuk validasi dan subset pengujian.
Akhirnya, data / images_box.txt berisi kotak pembatas pesawat, satu per gambar. Kotak pembatas ditentukan oleh empat angka: xmin, ymin, xmax dan ymax. Piksel kiri atas gambar telah terkoordinasi (1,1).
Kinerja pengklasifikasi diukur dalam hal akurasi klasifikasi rata-rata, seperti yang dijelaskan selanjutnya. Metrik evaluasi
Output dari algoritma klasifikasi harus berupa daftar kembar tiga dari jenis (gambar, label, skor), di managambar adalah label gambar, yaitu angka tujuh digit,label adalah label gambar, yaitu. varian model pesawat terbang, keluarga, atau produsen, danSkor adalah angka nyata yang mengekspresikan keyakinan pada penilaian.
Saat menghitung akurasi klasifikasi, gambar diberi label yang terkandung dalam triplet dengan skor tertinggi. Gambar yang belum matang dianggap tidak diklasifikasikan dan selalu dihitung sebagai kesalahan aklasifikasi (oleh karena itu lebih baik menebak setidaknya satu label untuk setiap gambar daripada membiarkannya tidak diklasifikasikan).
Kualitas prediksi diukur dalam hal rata-rataaccuracacy, diperoleh sebagai berikut:Matriks kebingungan adalah persegi, dengan satu baris per kelas.Setiap elemen dari matriks kebingungan adalah jumlah pesawat waktu dari kelas tertentu (ditentukan oleh baris) diklasifikasikan sebagai kelas dua (kolom). Idealnya, matriks kebingungan harus diagonal.Matriks kebingungan dinormalisasi baris oleh jumlah gambar dari kelas pesawat yang sesuai (setiap baris oleh karena itu berjumlah satu jika tidak ada gambar yang tidak diklasifikasikan).Akurasi rata-rata dihitung sebagai rata-rata diagonal matriks kebingungan.
Ada tiga tantangan: mengklasifikasikan varian pesawat, keluarga, dan produsen. Kode evaluasi
Protokol evaluasi telah diterapkan dalam m-fileevaluation MATLAB.m. Fungsi ini mengambil jalur ke folder data, nama acomposite yang menunjukkan subset evaluasi dan tantangan (misalnya 'manufacturer_test' atau 'family_val'), dan daftar perjalanan, dan mengembalikan matriks kebingungan. Misalnyagambar = {'2074164'} ;label = {'McDonnell Douglas MD-90-30'} ;skor = 1 ;kebingungan = evaluasi('/path/fgcv-aircraft/data', 'test', gambar, label, skor) ;akurasi = mean(diag(confusion)) ;
mengevaluasi output pengklasifikasi yang berisi tepat satu triplet (gambar, label, skor), di mana gambar adalah '2074164', kelas yang diprediksi adalah 'McDonnell Douglas MD-90-30', dan skor prediksi adalah1. Dalam praktiknya, satu set lengkap prediksi (satu untuk masing-masing pasangan kelasimage) biasanya dievaluasi.
Lihat bantuan builtin dari fungsi MATLAB evaluasi untuk detail praktik lebih lanjut. Lihat juga example_evaluation.m untuk contoh tentang cara menggunakan fungsi ini.
Tidak ada komentar: