微软的人脸识别数据库
微软一直都号称拥有最大的人脸数据库,任何人都可以使用它来训练面部识别算法。因为媒体的报道引发了关于隐私和道德问题的关注,曾经公开可用的数据集已经悄然消失。现已删除的数据集中包含超过1000万张面孔,这些面孔来自Flickr等网站,这些网站储存的是根据知识共享许可上传的照片——这意味着许多都可以免费,但可能有版权问题。其中的许多面孔不属于名人——包括记者和隐私研究人员——并且他们不知道自己的图像被包括在内。 当然,微软并不是唯一一家通过从开放的互联网上抓取照片来组装大型数据集的公司。调查显示,很多创业公司一直在使用照片收集应用程序暗中收集数百万张面孔,而其他公司则一直在扫描大量的大头照。
Database Pengenalan Wajah Microsoft
Microsoft selalu mengklaim memiliki database wajah terbesar, yang dapat digunakan siapa saja untuk melatih algoritma pengenalan wajah. Namun, karena laporan media yang memicu perhatian terhadap masalah privasi dan etika, kumpulan data yang sebelumnya tersedia untuk umum kini telah menghilang secara diam-diam. Kumpulan data yang telah dihapus tersebut berisi lebih dari 10 juta wajah, yang berasal dari situs seperti Flickr—platform yang menyimpan foto yang diunggah berdasarkan lisensi Creative Commons. Ini berarti banyak foto yang dapat digunakan secara gratis, tetapi mungkin memiliki masalah hak cipta. Banyak dari wajah dalam database ini bukanlah milik selebriti—termasuk jurnalis dan peneliti privasi—dan mereka tidak mengetahui bahwa gambar mereka telah dimasukkan ke dalamnya. Tentu saja, Microsoft bukan satu-satunya perusahaan yang mengumpulkan dataset besar dengan mengambil foto dari internet terbuka. Investigasi menunjukkan bahwa banyak perusahaan rintisan telah diam-diam mengumpulkan jutaan wajah melalui aplikasi pengumpulan foto, sementara perusahaan lain terus memindai sejumlah besar foto wajah.