Mendeleiev – o Data Scientist

Mendeleiev – o Data Scientist

Quando li por primeira vez a famosa frase “O que não se mede não se gerencia atribuída a Peter Drucker e que traduz a essência que os KPIs devem ter, em seguida veio a minha mente uma outra do químico russo, criador da Tabela Periódica dos elementos químicos, Dmitri Mendeleiev  “A ciência começa onde começa a medição…

Mendeleiev - o Data Scientist

Esta frase me acompanhou durante vários anos quando estudava engenharia, ela estava pendurada na porta do laboratório de sensores da Universidade Técnica de San Petersburgo, onde Mendeleiev foi fundador de uma das cátedras e de certa maneira guiou minha vida profissional.

Tabela Periódica de Mendeleiev é fascinante pela sua simplicidade, ela aparece tanto em livros escolares como em teses de doutorado, possui um desenho moderno (user friendly e até diria touch!) e combina capacidades impares de explicação, representação e previsão. Mais que uma solução a um problema da química, é um exercício supremo de raciocínio do machine learning data visualization, e também daquilo  que hoje resumimos como Data Science.

Em 1869, enquanto trabalhava em seu livro Princípios de Química Mendeleiev, escreveu os nomes dos elementos e algumas das suas principais propriedades em fichas individuais, para poder assim facilitar a classificação. Enquanto ordenava as fichas, ele descobriu a existencia de um padrão que nós conhecemos agora como a tabela periódica. Mendeleiev ordenou as fichas segundo os pesos atômicos dos elementos que formavam óxidos similares. Ao classificar por linhas e por colunas, ele estabeleceu a estrutura da tabela periódica usado desde então.

A Tabela Periódica de Mendeleiev é um exercício supremo do raciocínio do  Data Science

O gênio de Mendeleiev reside no fato de que ele percebeu que os elementos tem uma ordem fundamental: ele não projetou a tabela periódica, ele a descobriu! Ele não só foi capaz de prever a existência de (então) novos elementos representados por “buracos” na tabela, mas também forneceu estimativas precisas de suas propriedades químicas e físicas. Em alguns casos, Mendeleiev também alterou a ordem dos pesos atômicos, de modo que os elementos semelhantes aparecessem  no mesmo grupo. Esta aparente anomalia foi explicada posteriormente na teoria de isótopos.

Mendeleiev - o Data Scientist

Na figura acima, versão da tabela periódica de Mendeleiev, da primeira edição do seu livro de texto.

A classificação dos elementos químicos é um problema clássico de classificação guiado pelos dados. Apesar de existir hoje diversos algoritmos que poderiam chegar a resultados semelhantes, continua sendo uma solução não trivial. Vejam nas seguintes referencias intentos interessantes que abordam esta questão. 

Mendeleiev - o Data Scientist

Mendeleiev resolveu esta questão sem possuir os recursos computacionais atuais  e com o agravante de estar diante de um problema com censura, já que muitos componentes ainda não tinham sido  descobertos e portanto, tinham que ter seus espaços previstos e “guardados” na tabela.

Recentemente a Tabela ganhou quatro novos elementos químicos, completando sua sétima linha, os livros de química acabaram  ficando desatualizados mas não a genialidade da Tabela, que continua sendo a referência da classificação dos componentes químicos que nos rodeiam – tanto para cientistas como para milhões de pessoas comuns … e para nós, os cientistas de dados, um exemplo da mescla perfeita  Data + Science!

(Publicado no Linkedin)