Facebook cria projeto para ensinar inteligência artificial pela perspectiva humana

Facebook cria projeto para ensinar inteligência artificial pela perspectiva humana

Iniciativa Ego4D usará mais de 2.200 horas de vídeo em primeira pessoa para permitir a criação de sistemas que entendam o mundo a partir do centro de ação.

O Facebook está trabalhando em um projeto para criar sistemas de inteligência artificial que saibam analisar imagens a partir da perspectiva de um ser humano, e não apenas como um observador.

A expectativa da empresa é que a iniciativa ajude dispositivos de realidade aumentada e realidade virtual a entenderem melhor o ponto de vista em primeira pessoa.

“A inteligência artificial geralmente aprende com fotos e vídeos capturados em terceira pessoa, mas a inteligência artificial de próxima geração precisará aprender com vídeos que mostram o mundo a partir do centro de ação”, afirmou o Facebook.

A iniciativa, batizada de Ego4D, prevê pesquisas a partir de mais de 2.200 horas de vídeo em primeira pessoa que foram gravadas em um projeto que acompanhou a rotina de 700 voluntários.

Segundo o Facebook, o material foi coletado em parceria com 13 universidades e laboratórios de 9 países, e permitiu a criação de um conjunto de dados 20 vezes maior que qualquer outro disponível para pesquisadores.

Como funciona o projeto do Facebook

A empresa definiu cinco pilares para guiar o desenvolvimento de sistemas de inteligência artificial que serão treinados com essas imagens.

Um deles é chamado de “memória episódica”, que pode indicar o que e quando algo aconteceu. De acordo com a companhia, esse conceito poderá ajudar usuários a encontrarem objetos perdidos, por exemplo.

O segundo conceito é o de “previsão”, em que a inteligência artificial ajudaria com o que deve ser feito a seguir, como mostrar o próximo passo para preparar uma refeição.

Há ainda o pilar de “manipulação de mãos e objetos”, que seria capaz de entender o que um usuário está fazendo. O Facebook diz que ele poderia ser útil para ensinar a tocar um instrumento musical.

O quarto pilar é chamado de “diarização audiovisual”, que entenderia quem disse algo e quando isso aconteceu, e poderia resumir o assunto discutido em uma aula.

O quinto pilar é o de “interação social”, em que a inteligência artificial ajudaria o usuário a prestar mais atenção em um ponto específico, o que permitiria, por exemplo, ouvir melhor uma pessoa em um local barulhento.

Para o Facebook, a criação de sistemas de inteligência artificial a partir de uma nova perspectiva pode “desbloquear uma nova era de experiências imersivas”.

Fonte: G1

Compartilhe