IA para melhoramento de plantas em um clima em constante mudança

Como a inteligência artificial (IA) pode impactar a agricultura, a indústria de alimentos e o campo da bioengenharia? Dan Jacobson, membro da equipe de pesquisa e desenvolvimento da Divisão de Biociências do Laboratório Nacional Oak Ridge (ORNL) do Departamento de Energia dos EUA (DOE), tem algumas idéias.

Nos últimos 5 anos, Jacobson e sua equipe estudaram plantas para entender as variáveis ​​e padrões genéticos que os tornam adaptáveis ​​às mudanças de ambientes e climas. Como biólogo computacional, Jacobson usa alguns dos supercomputadores mais poderosos do mundo para o seu trabalho – incluindo o recentemente desativado Cray XK7 Titan e o supercomputador mais poderoso e inteligente do mundo para a ciência aberta, o supercomputador IBM AC922 Summit, ambos localizados na Oak Ridge Leadership Computing Facility (OLCF), uma facilidade de usuário do DOE Office of Science no ORNL.

No ano passado, Jacobson e sua equipe ganharam o Prêmio Gordon Bell da Association for Computing Machinery depois de usar uma técnica de computação especial conhecida como “precisão mista” no Summit para se tornar o primeiro grupo a atingir velocidade exascale – aproximadamente um quintilhão de cálculos por segundo.

A equipe de Jacobson está atualmente trabalhando em vários projetos que formam um roteiro integrado para o futuro da IA ​​em melhoramento de plantas e bioenergia. O trabalho da equipe foi apresentado em Trends in Biotechnology em outubro.

Nesta sessão de perguntas e respostas, Jacobson fala sobre o trabalho de sua equipe em um algoritmo de seleção genômica, sua visão para o futuro da genômica ambiental e o espaço onde a simulação encontra a IA.

Em que sua equipe está trabalhando no ano passado?

Jacobson: Estamos trabalhando em algumas coisas. Recentemente, desenvolvemos novas maneiras de fazer o que é chamado “seleção genômica” ou projetar um organismo para fins de reprodução. Desenvolvemos um novo algoritmo de seleção genômica que é impulsionado por métodos emergentes de aprendizado de máquina chamados coletivamente de “IA explicável”, que é um campo que aprimora os métodos de IA do classificador de caixa preta, tentando entender como esses algoritmos tomam decisões.

Esse algoritmo nos ajuda a determinar quais variações em um genoma precisamos combinar para produzir plantas que podem se adaptar aos seus ambientes. Isso informa os esforços de criação, edição de genes ou combinações desses, dependendo do tipo de estratégia de bioengenharia que você deseja adotar.

No ano passado, você ganhou um prêmio Gordon Bell depois de quebrar a barreira da exascale com um código que permite estudar interações combinatórias entre organismos e seus ambientes. Como esse algoritmo se encaixa nessa pesquisa?

Jacobson: Ainda estamos usando o modelo que usamos no ano passado, mas agora introduzimos esse algoritmo de seleção genômica orientado por IA ao nosso código de métricas combinatórias [CoMet] e fornecemos informações ambientais todos os dias do ano , para que possamos realizar estudos de associação em todo o genoma ao longo do tempo climático.

Além disso, expandimos para uma escala global nossos esforços no que chamamos de “tipos climáticos” – as informações climáticas e ambientais às quais as plantas estão se adaptando. Com a ajuda de Peter Thornton, do ORNL, e da experiência de seu grupo em biogeografia e clima, construímos modelos de cada quilômetro quadrado de terra do planeta e codificamos 50 anos de dados ambientais e climáticos nesses modelos, desde o solo até o espectro de luz. qualidade e tudo mais.

Para entender todos os relacionamentos entre diferentes ambientes, comparamos esses ambientes no Summit usando um novo algoritmo chamado Duo que adicionamos à nossa base de códigos CoMet. Para nosso conhecimento, este é o maior cálculo científico já feito.

Isso soa como uma realização bastante pesada. Que tipo de informação essas comparações podem fornecer?

Jacobson: Essas comparações podem nos ajudar a determinar exatamente onde podemos atingir certos ambientes e quais mutações e alelos genéticos precisamos incluir para ajudar essas plantas a se adaptarem a diferentes ambientes. Podemos olhar para um ambiente e dizer: “Para esse ambiente, é isso que precisaremos ter no genoma dessa planta para que ela prospere da melhor maneira possível”.

Esse é o futuro da genômica ambiental?

Jacobson: A visão integrada que vemos é a conexão de todas as camadas “-omicas”, desde genômica ( expressão gênica ), proteômica (expressão proteica) e metabolômica (expressão metabólica) até os fenótipos – características observáveis; então, do genoma ao fenômeno e tudo mais.

Idealmente, gostaríamos de ter uma combinação de dados genotípicos com dados climáticos e ambientais em um modelo integrado, desde nucleotídeos únicos – as estruturas moleculares que compõem o DNA – até o ambiente e o clima em escala planetária. Agora, esses modelos integrados abrangentes são possíveis porque, na verdade, calculamos a escala espectral da luz de todos os pontos do planeta – esse é um fenótipo astrofísico que vem da nossa estrela mais próxima, o Sol.

Primeiro, precisamos examinar as interações combinatórias em tais modelos para ver como elas levam às propriedades emergentes que estamos tentando otimizar nas plantas para produtividade e sustentabilidade futuras. Em seguida, podemos conectar isso com a forma como as plantas se adaptaram historicamente aos ambientes, a fim de projetar novos genótipos ideais para bioenergia ou produção de alimentos que são otimizados para prosperar em ambientes específicos.

Isso é algo que será necessário na agricultura no futuro?

Jacobson: À medida que o mundo muda, há uma pressão crescente para utilizar “terras marginais”, que são terras que atualmente não são usadas atualmente para a agricultura ou que não são usadas com eficiência na agricultura. Portanto, se projetarmos genótipos que prosperam nesses ambientes marginais, poderemos aumentar nossa produção de alimentos, além da produção de energia. Esta é uma tecnologia de uso duplo.

Também estamos realmente preocupados com a super fertilização da terra, pois ela pode levar a escoamentos com grandes conseqüências ecológicas. Se pudermos otimizar as plantas para usar os nutrientes existentes com pouco fertilizante adicional, isso também será um grande benefício para a sustentabilidade. Então, estamos realmente tentando analisar isso de forma holística e criar o máximo dessas adaptações que pudermos no modelo, para que possamos conhecer os efeitos em determinados ambientes.

Em que você irá trabalho em seguida?

Jacobson: O próximo passo é examinar os dados históricos e todos esses relacionamentos e, em seguida, projetar para a frente, para que possamos realmente projetar genótipos que não apenas prosperem nas zonas ambientais atuais, mas continuem a prosperar no futuro, à medida que a rede global mudar. A capacidade de projetar adiante, tanto para as culturas anuais quanto para as perenes a longo prazo, é realmente importante.

Quais são alguns desafios restantes?

Jacobson: Tudo o que estamos fazendo é um trabalho pesado, mas estamos vendo como podemos projetar essa nova abordagem no Summit e no futuro sistema de exascale do OLCF, Frontier, para que possamos realmente entender todos esses relacionamentos. Além disso, agora que temos esses dados em todas essas camadas “-omics”, precisamos executar essas combinações de camadas – chamadas polítopos – milhares ou dezenas de milhares ou centenas de milhares de vezes. O próximo conjunto de algoritmos que estamos construindo é encontrar todos os relacionamentos e associações possíveis dentro e através de todos os polítopos. Essa é a próxima fronteira.

Seu trabalho se cruzará com os modelos tradicionais de simulação climática?

Jacobson: Essa é uma visão de informações climáticas orientada por dados e por IA, que é diferente de uma abordagem de simulação. Com o tempo, será interessante ver onde eles se cruzam, e pode haver coisas que aprendemos aqui que são muito informativas para modelos climáticos e vice-versa. Também sabemos que esse mesmo tipo de tecnologia de IA explicável pode ajudar muito nos estudos de simulação. Idealmente, poderíamos desenvolver modelos explicáveis ​​orientados por IA que podem ajudar os modelos de simulação com alguns de seus gargalos. Se pudermos aprender os padrões que os modelos de simulação usam e substituir alguns de seus gargalos por um resultado aprendido, esses modelos poderão fazer coisas mais criativas. É aí que podemos ver parte desse espaço se cruzando no futuro.



PROPAGANDA
PROPAGANDA
PROPAGANDA