Com os dados prontos, que são os ingredientes na nossa analogia de restaurante, é hora de treinar o modelo. Isso é como testar receitas. Esta fase envolve duas etapas. O treinamento do modelo, que é como cozinhar a receita, e a avaliação do modelo, que é quando provamos para saber se a receita está boa. Esse processo pode ser iterativo. Antes de analisarmos essa etapa com mais detalhes vamos esclarecer dois termos: inteligência artificial e machine learning. A inteligência artificial, ou IA, é um termo geral que inclui coisas relacionadas à maneira como computadores imitam a inteligência humana. Por exemplo, em um processador de texto on-line robôs realizam atividades humanas, como verificar a ortografia. O machine learning é um subconjunto da IA que se refere principalmente a aprendizado supervisionado e não supervisionado. Talvez você veja o termo aprendizado profundo ou redes neurais profundas. É um subconjunto de machine learning que adiciona camadas entre dados de entrada e os resultados da saÃda para fazer um machine learning mais aprofundado. Qual é a diferença entre aprendizado supervisionado e não supervisionado? O supervisionado é orientado a tarefas e identifica o objetivo. Já o não supervisionado é orientado a dados e identifica um padrão. Uma maneira fácil de diferenciar os dois é que o aprendizado supervisionado fornece a cada ponto de dados um identificador ou resposta, já o não supervisionado não fornece. Por exemplo, se trabalharmos com dados de vendas de um varejista on-line, podemos usar o aprendizado supervisionado para prever a tendência de vendas durante os próximos meses e usar o aprendizado não supervisionado para agrupar os clientes com base em caracterÃsticas comuns. Há dois tipos principais de aprendizado supervisionado. O primeiro é classificação, que prevê uma variável categórica. como usar uma imagem para diferenciar um gato de um cão. O segundo tipo é um modelo de regressão, que prevê um número contÃnuo, como usar vendas passadas de um item para prever uma tendência futura. Também há três tipos principais de aprendizado não supervisionado. O primeiro é o clustering, que agrupa pontos de dados com caracterÃsticas semelhantes e os atribui para os clusters, como usar a demografia de clientes para determinar a segmentação deles. O segundo é a associação, que identifica relações subjacentes, como a correlação entre dois produtos, para posicioná-los perto um do outro em uma promoção no mercado. O terceiro é a redução de dimensionalidade, que reduz um número de dimensões ou atributos em um conjunto de dados para melhorar a eficiência de um modelo. Por exemplo, combinar caracterÃsticas de um cliente, como idade, histórico de multas ou tipo do carro para criar uma cotação de seguro. Se muitas dimensões forem incluÃdas, muitos recursos computacionais serão usados, o que pode tornar o modelo ineficaz. Embora o Google Cloud forneça quatro opções de machine learning com o AutoML e APIs pré-criadas, não é necessário especificar um modelo de machine learning. Em vez disso, defina seu objetivo, como tradução de texto ou detecção de imagem. Então, no back-end, o Google vai selecionar o melhor modelo para seu objetivo de negócios. Com as outras duas opções, BigQuery ML e treinamento personalizado, é necessário especificar em qual modelo você quer treinar seus dados e atribuir hiperparâmetros. Hiperparâmetros são como botões definidos pelo usuário em uma máquina que ajudam a guiar o processo de machine learning. Por exemplo, um parâmetro é a taxa de aprendizado, que é a velocidade que você quer que a máquina aprenda. Com o AutoML, você não se preocupa com ajustes de botões de hiperparâmetros porque o ajuste acontece automaticamente no back-end. Isso é feito em grande parte por uma pesquisa de arquitetura neural, que encontra o modelo mais adequado, comparando o desempenho de milhares de outros modelos.