paint-brush
Apresentando o BANMo: de imagens de gatos a modelos 3D deformáveispor@whatsai
1,521 leituras
1,521 leituras

Apresentando o BANMo: de imagens de gatos a modelos 3D deformáveis

por Louis Bouchard4m2022/08/14
Read on Terminal Reader
Read this story w/o Javascript

Muito longo; Para ler

BANMo é uma abordagem inspirada em NeRF compartilhada no evento CVPR 2022 do qual participei algumas semanas atrás. Tira fotos para criar modelos 3D deformáveis. O modelo começa com alguns vídeos feitos casualmente do objeto que você deseja capturar, mostrando como ele se move e se deforma. O resultado inicial lhe dará informações sobre a forma do objeto e sua compreensão da aparência e da forma do seu objeto. Saiba mais no vídeo......ou no artigo completo: https://www.louisbouchard.ai/banmo/

Company Mentioned

Mention Thumbnail
featured image - Apresentando o BANMo: de imagens de gatos a modelos 3D deformáveis
Louis Bouchard HackerNoon profile picture

Aqui está o BANMo, uma abordagem inspirada em NeRF compartilhada no evento CVPR 2022 do qual participei algumas semanas atrás.

O BANMo tira fotos para criar modelos 3D deformáveis. Se você trabalha com efeitos visuais, desenvolvimento de jogos ou criação de cenas 3D, este novo modelo de IA é para você. Eu não ficaria surpreso em ver este modelo ou abordagens semelhantes em seu pipeline de criação muito em breve, permitindo que você gaste muito menos tempo, dinheiro e esforço na criação de modelos 3D. Saiba mais no vídeo...

Referências

►Leia o artigo completo: https://www.louisbouchard.ai/banmo/
►Página do projeto: https://banmo-www.github.io/
►Papel: Yang, G., Vo, M., Neverova, N., Ramanan, D., Vedaldi, A. e
Joo, H., 2022. Banmo: Construindo modelos 3D neurais animáveis de muitos
vídeos casuais. In Proceedings of the IEEE/CVF Conference on Computer
Visão e Reconhecimento de Padrões (pp. 2863–2873).
►Código: https://github.com/facebookresearch/banmo
►Meu boletim informativo (um novo aplicativo de IA explicado semanalmente para seus e-mails!): https://www.louisbouchard.ai/newsletter/

Transcrição de vídeo

0:00

se você estiver no desenvolvimento de jogos VFX ou

0:02

criando cenas 3D este novo modelo AI é

0:06

para você eu não ficaria surpreso em ver

0:08

este modelo ou abordagens semelhantes em seu

0:10

pipeline de criação muito em breve permitindo

0:12

você gaste muito menos tempo dinheiro e

0:14

esforço em fazer modelos 3D basta olhar

0:18

que é claro que não é perfeito, mas que

0:20

foi feito instantaneamente com um vídeo casual

0:23

tirado de um telefone que não precisava de um

0:25

configuração de câmera midi cara ou complexa

0:28

sensores de profundidade uma das belezas por trás

0:31

IA tornando complexa e cara

0:33

As tecnologias disponíveis para startups são

0:35

individuais para criar projetos

0:37

com resultados de qualidade profissional apenas

0:40

filmar um objeto e transformá-lo em um

0:42

modelo que você pode importar imediatamente você pode

0:45

em seguida, ajuste os detalhes se você estiver

0:46

não satisfeito, mas todo o modelo vai

0:49

estar lá dentro de alguns segundos o que

0:51

você tem visto são os resultados de

0:52

um modelo de IA chamado banmu recentemente compartilhado

0:55

no evento da cvpr que participei estarei

0:58

honestamente, eles chamaram minha atenção porque

1:00

por causa dos gatos ainda não foi

1:02

clickbait completamente o papel e

1:05

abordagem é realmente incrível

1:07

não é como a outra abordagem Nerf para

1:09

reconstrução de objetos em modelos 3D

1:11

o modo banido aborda uma rechamada de tarefa

1:13

reconstrução de forma 3D articulada

1:16

o que significa que funciona com vídeos e

1:18

imagens para modelar objetos deformáveis e

1:22

o que é mais deformável do que um gato e

1:24

o que é ainda mais legal do que ver o

1:26

resultados é entender como funciona

1:29

o modelo começa com alguns casualmente

1:31

vídeos feitos do objeto que você deseja

1:34

captura mostrando como ele se move e se deforma

1:36

em si é onde você deseja enviar um

1:38

vídeo do seu gato comendo em um vaso

1:41

bamboo leva esses vídeos para criar então

1:44

o que eles chamam de espaço canônico

1:47

este resultado inicial lhe dará

1:49

informações sobre a forma do objeto

1:51

aparência e articulações é o

1:53

compreensão do modelo de seu objeto

1:55

moldar como ele se move através do espaço e

1:57

onde ele pertence entre um tijolo e um

1:59

sangue descrito por aquelas grandes bolas e

2:01

várias cores então leva este 3D

2:04

representação e aplica qualquer pose que você

2:06

quer simular o comportamento do gato e

2:08

articulações tão próximas da realidade quanto

2:11

possível parece mágica não é

2:13

isso é porque não terminamos aqui nós

2:16

rapidamente passou de um vídeo para o modelo

2:18

mas é aqui que se torna interessante

2:20

então o que eles usam para ir de imagens de

2:23

um vídeo para tal representação neste

2:25

espaço canônico você adivinhou um

2:28

modelo tipo nerf se você não estiver familiarizado

2:30

com esta abordagem eu convido você

2:32

para assistir a um dos muitos vídeos que fiz

2:34

cobrindo-os e volte para o resto

2:36

inserir o método inspirado em Nerf irá

2:39

tem que prever três essenciais

2:40

propriedades usadas para cada

2:42

pixel tridimensional ou voxels do

2:46

objeto como você vê aqui densidade de cor e

2:49

uma incorporação canônica usando um neural

2:51

rede treinada para isso conseguir um 3D

2:54

modelo com articulações realistas e

2:56

o movimento banmu usa o espaço da câmera

2:59

localização em vários quadros para

3:01

entender a matriz da qual é

3:03

filmagem permitindo-lhe reconstruir e

3:05

melhorar o modelo 3D de forma iterativa através

3:07

todos os quadros dos vídeos semelhantes ao que

3:10

faremos para entender o movimento de um objeto

3:12

ao redor e olhe para ele em tudo

3:14

direções esta parte é feita

3:16

automaticamente observando os vídeos

3:18

graças à incorporação canônica que

3:20

acabei de mencionar que esta incorporação irá

3:22

conter todas as características necessárias de cada

3:24

parte do objeto para permitir que você consulte

3:27

com uma nova posição desejada para o

3:29

objeto e forçando um coerente

3:31

reconstrução dada observações

3:33

irá basicamente mapear a posição Procurada

3:35

da imagem até o modelo 3D com

3:38

os pontos de vista e iluminação corretos

3:40

condições e fornecer Q é para o

3:42

forma necessária e articulações um último

3:45

coisa a mencionar é nossas cores aquelas

3:47

as cores representam o corpo do gato

3:49

atributos compartilhados nos diferentes

3:51

vídeos e imagens que usamos este é o

3:54

recurso que vamos aprender e olhar para

3:57

obter informações valiosas de todos

3:59

vídeos e mesclá-los no mesmo 3D

4:01

modelo para melhorar nossos resultados e pronto

4:05

você acaba com este lindo 3D

4:08

corte de calorias deformável que você pode usar em

4:10

suas aplicações é claro que isso foi

4:13

apenas uma visão geral de banmu e eu convido

4:15

você a ler o jornal para um conhecimento mais profundo

4:17

compreensão do modelo que você deve

4:19

com certeza se inscreva no canal se

4:21

esse tipo de notícia de IA interessa a você como

4:23

Estou compartilhando abordagens emocionantes semelhantes

4:26

toda semana obrigado por assistir até

4:28

o fim e eu vou te ver na próxima semana

4:30

com outro papel incrível

4:32

estrangeiro

4:36

[Música]