O que é a placa PCIe HTX301 da Skymizer
A empresa taiwanesa Skymizer apresentou um acelerador de IA fora do padrão, o HTX301. Segundo a própria companhia, o hardware consegue executar grandes modelos de linguagem com até 700 bilhões de parâmetros usando uma única placa PCIe.
Em vez de apostar em processos de fabricação de ponta e em memória HBM (cara e de alta velocidade), a proposta combina chips em 28 nm com memória LPDDR4/LPDDR5 - componentes mais tradicionais para este tipo de produto.
Memória de até 384 GB e consumo de 240 W
O foco central da Skymizer não é perseguir a maior potência de computação possível, e sim maximizar capacidade de memória e eficiência energética. Na HTX301, a empresa integra até 384 GB de memória, distribuídos entre seis chips especializados HyperThought HTX301.
De acordo com a Skymizer, o consumo do conjunto fica em torno de 240 W, um patamar bem inferior ao de aceleradores atuais da Nvidia e da AMD na mesma categoria.
Desempenho em tokens e compressão de pesos/KV-cache
A Skymizer afirma que a placa consegue entregar até 30 tokens por segundo ao rodar modelos gigantes e até 240 tokens por segundo em modelos menores, como o Llama2 7B.
Para alcançar esses números, a empresa diz usar algoritmos específicos de compressão de pesos e do KV-cache. Na descrição dos desenvolvedores, isso permitiria ao HTX301 superar o motor open source llama.cpp em 9–17,8%.
Inferência local e servidores comuns com arrefecimento a ar
Outro ponto defendido pela Skymizer é que o seu produto ataca um dos grandes entraves do IA corporativo: a necessidade de montar uma infraestrutura cara, com clusters de GPU, arrefecimento complexo e consumo energético elevado.
Na visão da empresa, o HTX301 foi pensado para ser instalado em servidores comuns, com arrefecimento a ar, sem exigir reformas ou modernizações em data centers.
Os desenvolvedores também destacam o valor de executar modelos de IA localmente dentro das organizações. Para eles, isso ajuda a reduzir riscos de vazamento de dados, diminui a dependência de serviços em nuvem e evita gastos imprevisíveis com computação.
Comparações com Nvidia e AMD e quando chegam testes independentes
Em meio a aceleradores atuais, as promessas da Skymizer chamam atenção. Como referência, a placa PCIe AMD Instinct MI350P utiliza 144 GB de memória HBM3E e consome consideravelmente mais energia, enquanto a Nvidia RTX PRO 6000 Blackwell demanda cerca de 600 W.
Com isso, o startup taiwanês tenta sustentar que, para inferência em IA, não contam apenas os "teraflops brutos", mas também a arquitetura de memória e a forma eficiente de trabalhar com modelos.
Ainda assim, por enquanto, todos os números do HTX301 aparecem somente em apresentações da empresa. Testes independentes da placa devem ocorrer na Computex 2026, no início de junho. Esses resultados devem indicar se a Skymizer realmente criou uma alternativa barata aos aceleradores da Nvidia e da AMD - ou se o HTX301 vai se somar à longa lista de startups ambiciosas de IA que não conseguiram comprovar as próprias promessas.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário