O método engenhoso da Allozymes de testar rapidamente milhões de reações químicas à base de biologia está provando não apenas ser um serviço útil, mas a base de um conjunto de dados único e valioso. E onde há um conjunto de dados, há IA — e onde há IA, há investidores. A empresa acabou de levantar uma rodada Série A de $15 milhões para expandir seus negócios de um serviço útil para um recurso de classe mundial.
Nós cobrimos a startup de biotecnologia pela primeira vez em 2021, quando estava dando seus primeiros passos: “Naquela época éramos menos de cinco pessoas e em nosso primeiro laboratório — mil pés quadrados”, lembrou o CEO e fundador Peyman Salehian.
A empresa cresceu para 32 pessoas nos EUA, Europa e Singapura, e possui 15 vezes mais espaço de laboratório, que foi utilizado para acelerar sua técnica de triagem de enzimas, que já era exponencialmente mais rápida.
A tecnologia central da empresa não mudou desde 2021, e você pode ler a descrição detalhada dela em nosso artigo original. Mas a essência é que as enzimas, cadeias de aminoácidos que realizam determinadas tarefas em sistemas biológicos, até agora têm sido bastante difíceis de encontrar ou inventar. Isso se deve ao grande número de variações: Uma molécula pode ter centenas de ácidos, com 20 opções para cada posição, e cada permutação potencialmente um efeito totalmente diferente. Você rapidamente chega às bilhões de possibilidades!”
Usando métodos tradicionais, essas variações podem ser testadas a uma taxa de algumas centenas por dia em um espaço de laboratório razoável, mas a Allozymes utiliza um método no qual milhões de enzimas podem ser testadas por dia, empacotando-as em pequenas gotas e passando-as por um sistema microfluídico especial. Você pode pensar nisso como uma esteira rolante com uma câmera acima dela, escaneando cada item que passa rapidamente e os classificando automaticamente em diferentes compartimentos.
Essas enzimas podem ser praticamente qualquer coisa necessária na indústria de biotecnologia e química: Se você precisa transformar matérias-primas em certas moléculas desejáveis, ou vice-versa, ou executar numerosos outros processos fundamentais, as enzimas são a solução. Encontrar uma enzima barata e eficaz raramente é fácil, e até recentemente toda a indústria estava testando cerca de um milhão de possibilidades por ano — um número que a Allozymes pretende multiplicar mais de mil vezes, visando 7 bilhões de variantes em 2024.
“[Em 2021] estávamos apenas construindo as máquinas, mas agora elas estão funcionando muito bem e estamos triando até 20 milhões de variantes de enzimas por dia”, disse Salehian.
O processo já atraiu clientes em diversos setores, alguns dos quais a Allozymes não pode divulgar devido a acordos de confidencialidade, mas outros foram documentados em estudos de caso:
- Fiteno é uma enzima encontrada naturalmente em tomates e normalmente colhida em quantidades mínimas das cascas de milhões deles. A Allozymes encontrou um caminho para produzir o mesmo produto químico em um biorreator, usando 99% menos água (e presumivelmente espaço).
- Bisabolol é outro produto químico útil encontrado naturalmente na árvore candeia, uma planta nativa da Amazônia que foi levada ao status de ameaçada. Agora, um bisabolol bio-ídêntico pode ser produzido em qualquer quantidade usando um biorreator e o caminho enzimático da empresa.
- Fibras de plantas e frutas como bananas podem ser transformadas em uma substância chamada "fibra doce solúvel", uma alternativa a outros açúcares e adoçantes; A Allozymes recebeu uma bolsa de um milhão de dólares para acelerar esse processo não muito fácil. Salehian relata que fizeram biscoitos e bubble tea com os resultados.
Perguntei sobre a possibilidade de enzimas que degradam microplásticos, que têm sido alvo de muita pesquisa e também aparecem nos materiais promocionais da Allozymes. Salehian disse que, embora seja possível, atualmente não é economicamente viável sob seu modelo de negócios atual — basicamente, um cliente precisaria chegar à empresa dizendo: 'Eu quero pagar para desenvolver isso'. Mas está em seu radar, e eles podem estar trabalhando em reciclagem e manuseio de plásticos em breve.
Até agora, tudo isso mais ou menos se enquadra no modelo de negócios original da empresa, que consiste na otimização de enzimas como serviço. Mas o plano de ação envolve expandir para trabalhos mais feitos do zero, como encontrar uma molécula para atender a uma necessidade em vez de melhorar um processo existente.
O serviço de customização de enzimas que a Allozymes vem fazendo será chamado de SingZyme (como em única enzima) e continuará sendo uma opção inicial, preenchendo o caso de uso 'queremos fazer isso 100x mais rápido ou mais barato'. Um serviço mais abrangente chamado MultiZyme adotará uma abordagem mais avançada, descobrindo ou refinando várias enzimas para atender a uma necessidade mais geral 'precisamos de algo que faça isto'.
Os bilhões de pontos de dados que coletam como parte desses serviços permanecerão sua propriedade intelectual, no entanto, e constituirão 'a maior biblioteca de dados de enzimas do mundo', disse Salehian.
“Você pode fornecer a estrutura para o AlphaFold e ele dirá como ela se dobra, mas não pode dizer o que acontecerá se ela se ligar a outra substância,” disse Salehian, e é claro que essa reação é a única parte com a qual a indústria se preocupa. “Não há modelo de aprendizado de máquina no mundo que possa dizer exatamente o que fazer, porque os dados que temos são tão poucos e tão fragmentados; estamos falando de 300 amostras por dia por 20 anos,” um número que as máquinas da Allozymes podem facilmente superar em um único dia.
Salehian disse que estão desenvolvendo ativamente um modelo de aprendizado de máquina com base nos dados que têm, e até o testaram em um resultado conhecido.
“Alimentamos os dados para o modelo de aprendizado de máquina, e ele sugeriu uma nova molécula que estamos testando,” disse ele, o que é uma validação inicial promissora da abordagem.
A ideia não é inédita: Já cobrimos inúmeras empresas e projetos de pesquisa que descobriram que modelos de aprendizado de máquina podem ser muito úteis na classificação de grandes conjuntos de dados, oferecendo confiança extra mesmo que seus resultados não possam substituir o processo real.
A rodada Série A de $15 milhões inclui novos investidores Seventure Partners, NUS Technology Holdings, Thia Ventures e ID Capital, com investimentos repetidos da Xora Innovation, SOSV, Entrepreneur First e Transpose Platform.
Salehian disse que a empresa está em ótima forma e tem bastante tempo e dinheiro para alcançar suas ambições — com exceção de que pode levantar uma quantia menor ainda este ano para financiar uma expansão para o setor farmacêutico e abrir um escritório nos EUA.