Facebook cria projeto para ensinar inteligência artificial pela perspectiva humana
Iniciativa Ego4D usará mais de 2.200 horas de vídeo em primeira pessoa para permitir a criação de sistemas que entendam o mundo a partir do centro de ação.
O Facebook está trabalhando em um projeto para criar sistemas de inteligência artificial que saibam analisar imagens a partir da perspectiva de um ser humano, e não apenas como um observador.
A expectativa da empresa é que a iniciativa ajude dispositivos de realidade aumentada e realidade virtual a entenderem melhor o ponto de vista em primeira pessoa.
“A inteligência artificial geralmente aprende com fotos e vídeos capturados em terceira pessoa, mas a inteligência artificial de próxima geração precisará aprender com vídeos que mostram o mundo a partir do centro de ação”, afirmou o Facebook.
A iniciativa, batizada de Ego4D, prevê pesquisas a partir de mais de 2.200 horas de vídeo em primeira pessoa que foram gravadas em um projeto que acompanhou a rotina de 700 voluntários.
Segundo o Facebook, o material foi coletado em parceria com 13 universidades e laboratórios de 9 países, e permitiu a criação de um conjunto de dados 20 vezes maior que qualquer outro disponível para pesquisadores.
Como funciona o projeto do Facebook
A empresa definiu cinco pilares para guiar o desenvolvimento de sistemas de inteligência artificial que serão treinados com essas imagens.
Um deles é chamado de “memória episódica”, que pode indicar o que e quando algo aconteceu. De acordo com a companhia, esse conceito poderá ajudar usuários a encontrarem objetos perdidos, por exemplo.
O segundo conceito é o de “previsão”, em que a inteligência artificial ajudaria com o que deve ser feito a seguir, como mostrar o próximo passo para preparar uma refeição.
Há ainda o pilar de “manipulação de mãos e objetos”, que seria capaz de entender o que um usuário está fazendo. O Facebook diz que ele poderia ser útil para ensinar a tocar um instrumento musical.
O quarto pilar é chamado de “diarização audiovisual”, que entenderia quem disse algo e quando isso aconteceu, e poderia resumir o assunto discutido em uma aula.
O quinto pilar é o de “interação social”, em que a inteligência artificial ajudaria o usuário a prestar mais atenção em um ponto específico, o que permitiria, por exemplo, ouvir melhor uma pessoa em um local barulhento.
Para o Facebook, a criação de sistemas de inteligência artificial a partir de uma nova perspectiva pode “desbloquear uma nova era de experiências imersivas”.
Fonte: G1