Please take a moment to complete this survey below
Library's collection Library's IT development CancelHuman pose estimation merupakan topik penelitian bertujuan untuk mengestimasikan koordinat setiap sendi manusia dari video atau gambar yang nantinya akan dihubungkan sehingga membentuk kerangka manusia. Pengaplikasian dari human pose estimation bisa digunakan untuk human activity recognition, training robots, augmented reality, motion capture, dan motion tracking untuk console (kinect). Namu, terdapat beberapa tantangan yang perlu diatasi, yaitu: gerakan yang beraneka ragam, perbedaan tampilan tubuh yang beragam termasuk dengan pakaian, dan lingkungan yang kompleks yang menyebabkan susah membedakan foreground dan background. Dengan berkembangnya neural
network, peneliti sebelumnya mengatasi permasalahan tersebut dan menghasilkan hasil yang cukup akurat.
Input yang digunakan adalah video manusia yang menampilkan seluruh tubuh dengan melakukan gerakan. Video dikelola setiap frame untuk dideteksi letak bounding box orang dengan YOLOv4-Tiny. Selanjutnya, bounding box diteruskan pada EfficientNet Simple Baseline untuk mengestimasikan koordinat 2D setiap sendi. Dan pada akhirnya akan diteruskan VideoPose3D dengan mengestimasi koordinat 3D dari koordinat 2D.
Hasil pengujian modifikasi EfficientNet Simple Baseline menghasilkan kecepatan yang lebih cepat dengan waktu 4,54ms sedangkan Simple Baseline yang menghasilkan kecepatan 5,15ms. Akan tetapi akurasi modifikasi akan kurang akurat dengan rata-rata Percentage of Correct Keypoints head (PCKh@0.2) sebesar 86.82% dibandingkan Simple Baseline dengan rata-rata PCKh@0.2 sebesar 89.62%. Hal ini juga mempengaruhi hasil estimasi koordinat 3D menggunakan VideoPose3D dimana menggunakan modifikasi EfficientNet menghasilkan rata-rata Mean Per Joints Position Error (MPJPE) sebesar 25,3mm sedangkan Simple Baseline menghasilkan MPJPE sebesar 28.1 mm.