A Nvidia está apresentando hoje sua arquitetura de GPU Ampere de última geração. A primeira GPU a usar o Ampere será o novo A100 da Nvidia, desenvolvido para computação científica, gráficos em nuvem e análise de dados. Embora existam muitos rumores sobre os planos Ampere da Nvidia para placas GeForce “RTX 3080”, o A100 será usado principalmente em data centers.
O mais recente impulso do data center da Nvidia ocorre em meio a uma pandemia e um enorme aumento na demanda por computação em nuvem. Descrevendo a situação do coronavírus como “terrivelmente trágica”, o CEO da Nvidia, Jensen Huang, observou que “o uso de serviços na nuvem sofrerá um surto”, em uma coletiva de imprensa com a participação de The Verge. “Essas dinâmicas são realmente muito boas para nossos negócios de data center … Minha expectativa é que a Ampere tenha um desempenho notavelmente bom. É a nossa melhor GPU de data center já criada e capitaliza quase uma década de nossa experiência em data center “.
O A100 possui mais de 54 bilhões de transistores, tornando-o o maior processador de 7 nm do mundo. “Isso está basicamente próximo dos limites teóricos do que é possível hoje na fabricação de semicondutores”, explica Huang. “O maior dado que o mundo já fez e o maior número de transistores em um mecanismo de computação que o mundo já fez. “
A Nvidia está aprimorando seus núcleos Tensor para torná-los mais fáceis de usar para desenvolvedores, e o A100 também incluirá 19.5 teraflops de desempenho do FP32, 6, 912 núcleos CUDA, 40 GB de memória e 1.6TB / s de largura de banda da memória. Todo esse desempenho não está direcionando a versão mais recente do Assassin’s Creed, Apesar.
Em vez disso, a Nvidia está combinando essas GPUs em um sistema de IA empilhado que permitirá alimentar seus supercomputadores em data centers em todo o mundo. Assim como a Nvidia usou sua arquitetura Volta anterior para criar os sistemas Tesla V100 e DGX, um novo sistema DGX A100 AI combina oito dessas GPUs A100 em uma única GPU gigante.
O sistema DGX A100 promete 5 petaflops de desempenho, graças a esses oito A100s, e eles estão sendo combinados com a versão de terceira geração do NVLink da Nvidia. A combinação dessas oito GPUs significa 320 GB de memória GPU com 12,4 TB / s de largura de banda de memória. A Nvidia também está incluindo 15 TB de armazenamento interno Gen4 NVMe para alimentar tarefas de treinamento de IA. Pesquisadores e cientistas que usam os sistemas DGX A100 poderão dividir as cargas de trabalho em até 56 instâncias, distribuindo tarefas menores pelas poderosas GPUs.
$ Recentes da Nvidia6.9 A aquisição da Mellanox, fornecedora de redes de servidores, também está em jogo, já que o DGX A100 inclui nove interfaces de rede de 200 Gb / s, totalizando 3.6Tb / s por segundo de largura de banda bidirecional. À medida que os data centers modernos se adaptam a cargas de trabalho cada vez mais diversas, a tecnologia da Mellanox se mostra cada vez mais importante para a Nvidia. Huang descreve a Mellanox como o “tecido de conexão” muito importante na próxima geração de data centers.
“Se você observar como os data centers modernos são arquitetados, as cargas de trabalho que eles precisam executar são mais diversas do que nunca”, explica Huang. “Nossa abordagem daqui para frente não é apenas focar no servidor, mas pensar em todo o data center como uma unidade de computação. No futuro, acredito que o mundo pensará nos datacenters como uma unidade de computação e pensaremos na computação em escala de datacenter. Não somos mais apenas computadores pessoais ou servidores, mas vamos operar na escala do data center “.
:no_upscale()/cdn.vox-cdn.com/uploads/chorus_asset/file/19970191/2555435eba1e4170b270.81382692_NVIDIA_DGX_A100___Inside_View.jpg)
Os sistemas DGX A100 da Nvidia já começaram a ser enviados, com algumas das primeiras aplicações, incluindo a pesquisa em COVID-19 conduzida no Laboratório Nacional de Argonne dos EUA.
“Estamos usando os supercomputadores mais poderosos da América na luta contra o COVID-19, executando modelos e simulações de IA na mais recente tecnologia disponível, como a Nvidia DGX A100”, diz Rick Stevens, diretor de laboratório associado de Computação, Meio Ambiente e Ciências da Vida da Argonne. “O poder computacional dos novos sistemas DGX A100 que chegarão a Argonne ajudará os pesquisadores a explorar tratamentos e vacinas e a estudar a disseminação do vírus, permitindo que os cientistas realizem anos de trabalho acelerado por IA em meses ou dias”.
A Nvidia diz que a Microsoft, Amazon, Google, Dell, Alibaba e muitos outros grandes provedores de serviços em nuvem também planejam incorporar as únicas GPUs A100 em suas próprias ofertas. “A adoção e o entusiasmo pela Ampere de todos os hiperscalers e fabricantes de computadores de todo o mundo são realmente sem precedentes”, diz Huang. “Este é o lançamento mais rápido de uma nova arquitetura de data center que já tivemos e é compreensível”.
Assim como o sistema de cluster DGX A100 maior, a Nvidia também permite que cada GPU A100 individual seja particionada em até sete instâncias independentes para tarefas menores de computação. Esses sistemas não serão baratos, no entanto. O DGX A100 da Nvidia vem com grandes promessas de desempenho, mas os sistemas começam em US $ 199.000 por uma combinação de oito desses chips A100.
:no_upscale()/cdn.vox-cdn.com/uploads/chorus_asset/file/13109957/setienne_180914_2954_0085.jpg)
Ainda não está claro como a Nvidia fará o progresso do Ampere diretamente nas GPUs de nível consumidor ainda. A Nvidia apresentou sua arquitetura Volta, com processadores dedicados de inteligência artificial (núcleos tensores) da mesma maneira que a Ampere de hoje. Mas Volta não passou a alimentar a linha de produtos de consumo da GeForce da Nvidia. Em vez disso, a Nvidia lançou um $2, 999 Titan V (que ele chamou de “a GPU de PC mais poderosa já criada”) focada no processamento de IA e simulação científica, não em jogos ou tarefas criativas.
Apesar dos rumores de Volta alimentando as futuras placas GeForce, a Nvidia apresentou sua arquitetura Turing em 2018, que combinou seus núcleos tensores dedicados com novos recursos de rastreamento de raios. Turing passou a alimentar placas como a RTX 2080 em vez de Volta, apenas algumas semanas depois de Huang dizer que a próxima linha de placas gráficas não seria lançada por “muito tempo”. A Nvidia até retirou os núcleos RT e Tensor para placas alimentadas por Turing, como a GTX 1660 Ti.
Os novos cartões “RTX 3080” podem demorar apenas alguns meses, mas ainda não sabemos ao certo se eles usarão essa nova arquitetura de Ampere. “Há uma grande sobreposição na arquitetura, sem dúvida”, sugeriu Huang. “A configuração, o tamanho dos diferentes elementos do chip é muito diferente.”
A Nvidia usa memória HBM para suas GPUs de data center, e isso não é algo que a empresa usa para GPUs de jogos para PC de consumo. As GPUs do data center também se concentram muito mais em tarefas e computação de IA do que em gráficos. “Seremos muito mais influenciados pelos gráficos e menos pelo ponto flutuante de precisão dupla”, acrescenta Huang.
As especulações sobre os planos Ampere da Nvidia se intensificaram recentemente, e com o PlayStation 5 e o Xbox Series X será lançado com soluções de GPU baseadas em AMD ainda este ano, a Nvidia certamente precisará de algo novo para oferecer aos jogadores de PC ainda este ano.