{"id":118015,"date":"2022-12-09T08:00:00","date_gmt":"2022-12-09T11:00:00","guid":{"rendered":"https:\/\/fluency.io\/br\/blog\/?p=14466"},"modified":"2023-07-26T14:11:29","modified_gmt":"2023-07-26T17:11:29","slug":"naive-bayes","status":"publish","type":"post","link":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/","title":{"rendered":"Saiba tudo sobre Naive Bayes, um dos principais algoritmos de classifica\u00e7\u00e3o"},"content":{"rendered":"\n<p>A <strong>classifica\u00e7\u00e3o de dados<\/strong> \u00e9 um processo crucial em <a href=\"https:\/\/fluency.io\/br\/blog\/curso\/data-science\/?utm_source=blog&amp;utm_medium=post\" target=\"_blank\" rel=\"noreferrer noopener\">Data Science<\/a>, sendo bastante usado por <a href=\"https:\/\/fluency.io\/br\/blog\/diferenca-analista-cientista-dados\/?utm_source=blog&amp;utm_medium=post\" target=\"_blank\" rel=\"noreferrer noopener\">analistas e cientistas de dados <\/a>em <strong>an\u00e1lises estat\u00edsticas <\/strong>e ao calcular probabilidades. Nesse contexto, algoritmos como o <strong>Naive Bayes<\/strong> s\u00e3o um \u00f3timo exemplo de como<strong> solu\u00e7\u00f5es simples <\/strong>tendem a ser tamb\u00e9m as mais poderosas.\u00a0<\/p>\n\n\n\n<p>Apesar dos \u00faltimos avan\u00e7os em <a href=\"https:\/\/fluency.io\/br\/blog\/machine-learning\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\">Machine Learning<\/a>, esse <strong>classificador <\/strong>provou ser n\u00e3o apenas f\u00e1cil de usar, mas tamb\u00e9m r\u00e1pido, preciso e confi\u00e1vel. Por esse e outro motivos, ele tem sido usado com sucesso para muitos prop\u00f3sitos, al\u00e9m de funcionar particularmente bem quando o objetivo \u00e9 solucionar problemas de <a href=\"https:\/\/pt.wikipedia.org\/wiki\/Processamento_de_linguagem_natural\" target=\"_blank\" rel=\"noreferrer noopener\">Processamento de Linguagem Natural (NLP<strong>)<\/strong><\/a>.<\/p>\n\n\n\n<p>Neste artigo, voc\u00ea ir\u00e1 saber tudo sobre como o <strong>algoritmo Naive Bayes<\/strong>, como ele funciona, al\u00e9m de quando e como implement\u00e1-lo.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>O que \u00e9 Naive Bayes?<\/strong><\/h2>\n\n\n\n<p><strong>Naive Bayes<\/strong> \u00e9 um algoritmo probabil\u00edstico de<strong> Machine Learning<\/strong> baseado no <strong>Teorema de Bayes<\/strong> \u2014 uma f\u00f3rmula matem\u00e1tica usada para calcular probabilidades condicionais. Trata-se de uma ferramenta muito usada em uma ampla variedade de <strong>tarefas de classifica\u00e7\u00e3o<\/strong> no <a href=\"https:\/\/fluency.io\/br\/blog\/estatistica-para-data-science-entendendo-os-conceitos-fundamentais\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\">campo da estat\u00edstica<\/a>.\u00a0<\/p>\n\n\n\n<p>Altamente escal\u00e1vel e relativamente simples de implementar, o classificador <strong>Naive Bayes<\/strong> funciona muito bem para resolver os mais diversos problemas do mundo real, sendo capaz de ajudar na constru\u00e7\u00e3o de modelos de<strong> aprendizado de m\u00e1quina<\/strong> mais r\u00e1pidos e de acelerar previs\u00f5es.<\/p>\n\n\n\n<p>Al\u00e9m disso, eles t\u00eam a vantagem de <strong>escalonar linearmente<\/strong> na complexidade do tempo com o n\u00famero de recursos. Isso o torna uma ferramenta \u00fatil para <strong>dados de alta dimens\u00e3o<\/strong>.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img decoding=\"async\" width=\"550\" height=\"410\" src=\"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/O-que-e-Naive-Bayes.png\" alt=\"diagrama demonstrando o teorema de bayes\" class=\"wp-image-14467\" srcset=\"https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/O-que-e-Naive-Bayes.png 550w, https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/O-que-e-Naive-Bayes-515x384.png 515w, https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/O-que-e-Naive-Bayes-150x112.png 150w\" sizes=\"(max-width: 550px) 100vw, 550px\" \/><figcaption class=\"wp-element-caption\">O Teorema de Bayes calcula a probabilidade de um evento ocorrer dada a probabilidade de outro evento que j\u00e1 ocorreu. Imagem: <a href=\"https:\/\/www.geeksforgeeks.org\/naive-bayes-classifiers\/\">geeksforgeeks.org<\/a><\/figcaption><\/figure>\n<\/div>\n\n\n<p>Utilizado principalmente na <strong>classifica\u00e7\u00e3o de texto, <\/strong>as fun\u00e7\u00f5es desse algoritmo geralmente incluem classificar um <strong>conjunto de dados<\/strong> de treinamento de alta dimens\u00e3o.&nbsp;<\/p>\n\n\n\n<p>Basicamente, a partir da convers\u00e3o desses dados, fornecidos em<strong> tabelas de frequ\u00eancia<\/strong>, gerar uma tabela de verossimilhan\u00e7a e, por fim, \u00e9 poss\u00edvel encontrar probabilidades em rela\u00e7\u00e3o a determinados recursos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Afinal, o que \u00e9 um algoritmo de classifica\u00e7\u00e3o?<\/strong><\/h3>\n\n\n\n<p><strong>Algoritmo de Classifica\u00e7\u00e3o<\/strong> \u00e9 um ferramenta de <strong>Aprendizagem Supervisionada <\/strong>usada para identificar a categoria de novas observa\u00e7\u00f5es com base nos <strong>dados de treinamento<\/strong>.&nbsp;<\/p>\n\n\n\n<p>Na classifica\u00e7\u00e3o, um programa aprende com o <strong>conjunto de dado<\/strong>s ou observa\u00e7\u00f5es fornecidas e, em seguida, classifica a nova observa\u00e7\u00e3o em v\u00e1rias classes ou grupos. Tais classes podem ser chamadas de<strong> r\u00f3tulos ou categorias<\/strong>.<\/p>\n\n\n\n<p>Ao contr\u00e1rio da <strong>regress\u00e3o,<\/strong> a vari\u00e1vel de sa\u00edda da classifica\u00e7\u00e3o \u00e9 uma categoria, n\u00e3o um valor, como &#8220;verde ou azul&#8221;, &#8220;fruta ou animal&#8221; etc. significa que cont\u00e9m entrada com a sa\u00edda correspondente.<\/p>\n\n\n\n<p>No <strong>algoritmo de classifica\u00e7\u00e3o<\/strong>, uma fun\u00e7\u00e3o de sa\u00edda discreta (y) \u00e9 mapeada para a vari\u00e1vel de entrada (x). De acordo com o <strong>princ\u00edpio da \u00c1rvore de Decis\u00e3o<\/strong>, o modelo \u00e9 treinado com base nos dados e o <strong>modelo preditivo<\/strong> \u00e9 constru\u00eddo para mapear a decis\u00e3o baseada na \u00e1rvore.&nbsp;<\/p>\n\n\n\n<p>Considerando os recursos do conjunto de<strong> dados de treinamento<\/strong> e as classes especificadas, o algoritmo definir\u00e1 regras para classifica\u00e7\u00e3o.&nbsp;<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Qual \u00e9 a sua fun\u00e7\u00e3o?<\/strong><\/h3>\n\n\n\n<p>O principal objetivo do <strong>algoritmo de classifica\u00e7\u00e3o<\/strong> \u00e9 identificar a categoria de um determinado conjunto de dados e, \u200b\u200bprincipalmente, para prever a sa\u00edda dos <strong>dados categ\u00f3ricos<\/strong>.<\/p>\n\n\n\n<p>O algoritmo que implementa a classifica\u00e7\u00e3o em um conjunto de dados \u00e9 conhecido como <strong>classificador<\/strong>. Nesse caso, existem diferentes tipos:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Classificador Bin\u00e1rio: <\/strong>se o problema de classifica\u00e7\u00e3o tiver apenas dois resultados poss\u00edveis, ent\u00e3o \u00e9 chamado de Classificador Bin\u00e1rio. Por exemplo, \u201csim ou n\u00e3o\u201d, \u201cmasculino ou feminino\u201d, \u201cspam ou n\u00e3o spam\u201d, \u201ccachorro ou gato\u201d, etc.;<\/li>\n\n\n\n<li><strong>Classificador Multiclasse: <\/strong>se um problema de classifica\u00e7\u00e3o tiver mais de dois resultados, ele ser\u00e1 chamado de classificador multiclasse Por exemplo, classifica\u00e7\u00f5es de tipos de culturas, tipos de m\u00fasica etc.<\/li>\n\n\n\n<li><strong>Classifica\u00e7\u00e3o desbalanceada (Imbalanced Classification): <\/strong>o termo descreve tarefas de classifica\u00e7\u00e3o em que a distribui\u00e7\u00e3o de exemplos dentro de cada classe n\u00e3o \u00e9 igual. A maioria das inst\u00e2ncias do conjunto de dados de treinamento pertence \u00e0 classe normal, enquanto uma minoria pertence \u00e0 classe anormal. Diagn\u00f3sticos cl\u00ednicos, detec\u00e7\u00e3o de outliers e investiga\u00e7\u00e3o de fraudes s\u00e3o alguns exemplos.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Como funciona esse algoritmo?<\/strong><\/h3>\n\n\n\n<p>A classifica\u00e7\u00e3o \u00e9 um <strong>processo de categoriza\u00e7\u00e3o<\/strong> de um determinado conjunto de dados em classes, podendo ser realizada em dados estruturados ou n\u00e3o estruturados.&nbsp;<\/p>\n\n\n\n<p>Esse processo come\u00e7a com a <strong>previs\u00e3o da classe<\/strong> de determinados pontos de dados, em que as classes s\u00e3o muitas vezes referidas como alvo, r\u00f3tulo ou categorias.<\/p>\n\n\n\n<p>A <strong>modelagem preditiva de classifica\u00e7\u00e3o<\/strong> \u00e9 a tarefa de aproximar a fun\u00e7\u00e3o de mapeamento de vari\u00e1veis \u200b\u200bde entrada para vari\u00e1veis \u200b\u200bde sa\u00edda discretas. Nesse caso, o objetivo central \u00e9 identificar em qual classe\/categoria os novos dados se enquadrar\u00e3o.<\/p>\n\n\n\n<p>Os <strong>problemas de classifica\u00e7\u00e3o<\/strong> mais comuns s\u00e3o reconhecimento de fala, detec\u00e7\u00e3o de face, reconhecimento de manuscrito, classifica\u00e7\u00e3o de documentos, etc.&nbsp;<\/p>\n\n\n\n<p>Nesse sentido, o funcionamento dos algoritmos de classifica\u00e7\u00e3o abrange dois tipos:&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Lazy learners: <\/strong>leva menos tempo aprendendo e mais classificando dados;<\/li>\n\n\n\n<li><strong>Eager learners:<\/strong> leve mais tempo aprendendo e menos classificando dados (prevendo).<\/li>\n<\/ul>\n\n\n\n<p>As tarefas mais comuns das classifica\u00e7\u00f5es s\u00e3o:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>Classifica\u00e7\u00e3o bin\u00e1ria<\/li>\n\n\n\n<li>Classifica\u00e7\u00e3o multiclasse<\/li>\n\n\n\n<li>Classifica\u00e7\u00e3o de v\u00e1rios r\u00f3tulos<\/li>\n\n\n\n<li>Classifica\u00e7\u00e3o Desequilibrada<\/li>\n\n\n\n<li>Metodologia de Classifica\u00e7\u00e3o<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Quando usar o Naive Bayes?<\/strong><\/h3>\n\n\n\n<p><strong>Naive Bayes<\/strong> \u00e9 um dos algoritmos de classifica\u00e7\u00e3o mais simples e r\u00e1pidos que existem, sendo um dos mais indicado ao lidar com grandes volumes de dados. \u00c9 usado com sucesso em v\u00e1rias aplica\u00e7\u00f5es, tais como:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Filtragem de spam: <\/strong>&nbsp;funcionam correlacionando o uso de tokens (normalmente palavras, ou \u00e0s vezes outras coisas), com e-mails de spam e n\u00e3o spam e, em seguida, usa o teorema de Bayes para calcular a probabilidade de um e-mail ser ou n\u00e3o spam;<\/li>\n\n\n\n<li><strong>Classifica\u00e7\u00e3o de texto: <\/strong>pode ser aceito como a abordagem probabil\u00edstica para classificar documentos no caso de reconhecer a frequ\u00eancia de uma palavra espec\u00edfica em um documento de texto;<\/li>\n\n\n\n<li><strong>An\u00e1lise de sentimentos: <\/strong>atribui uma probabilidade de que uma determinada palavra ou frase seja considerada positiva ou negativa ao comparar palavras umas contra as outras;<\/li>\n\n\n\n<li><strong>Sistemas de recomenda\u00e7\u00e3o: <\/strong>usa t\u00e9cnicas de aprendizado de m\u00e1quina e minera\u00e7\u00e3o de dados para filtrar informa\u00e7\u00f5es n\u00e3o vistas e prever se um usu\u00e1rio gostaria de um determinado recurso ou n\u00e3o.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Como implementar o algoritmo Naive Bayes?<\/strong><\/h3>\n\n\n\n<p>Confira a seguir as principais etapas para a implementa\u00e7\u00e3o do algoritmo Naive Bayes:<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Passo 1: separa\u00e7\u00e3o por Classe<\/strong><\/h4>\n\n\n\n<p>Significa calcular a probabilidade dos dados pela classe a que pertencem, a chamada taxa base. Sendo assim, primeiro \u00e9 necess\u00e1rio separar dados de treinamento por classe.<\/p>\n\n\n\n<p>Para isso, voc\u00ea pode criar um objeto de dicion\u00e1rio onde cada chave \u00e9 o valor da classe e ent\u00e3o adicionar uma lista de todos os registros como o valor no dicion\u00e1rio.<\/p>\n\n\n\n<p>A fun\u00e7\u00e3o chamada <em>separate_by_class()<\/em> que implementa essa abordagem. Ele assume que a \u00faltima coluna em cada linha \u00e9 o valor da classe.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Passo 2: resumir o conjunto de dados<\/strong><\/h4>\n\n\n\n<p>Precisamos de duas estat\u00edsticas de um determinado conjunto de dados. Elas s\u00e3o a m\u00e9dia e o desvio padr\u00e3o (desvio m\u00e9dio da m\u00e9dia).<\/p>\n\n\n\n<p>A m\u00e9dia \u00e9 o valor m\u00e9dio e pode ser calculada como:<\/p>\n\n\n\n<p><em>m\u00e9dia = soma(x)\/n * contagem(x)<\/em><\/p>\n\n\n\n<p>Onde x \u00e9 a lista de valores ou uma coluna que estamos procurando.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Passo 3: resumir os dados por classe<\/strong><\/h4>\n\n\n\n<p>Exigimos estat\u00edsticas de nosso conjunto de dados de treinamento organizado por classe.<\/p>\n\n\n\n<p>Depois de desenvolver a fun\u00e7\u00e3o <em>separate_by_class()<\/em> para separar um conjunto de dados em linhas por classe e <em>summary_dataset() <\/em>para calcular estat\u00edsticas resumidas para cada coluna, agora \u00e9 preciso juntar tudo isso e resumir as colunas no conjunto de dados organizadas por valores de classe.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Passo 4: Fun\u00e7\u00e3o de densidade de probabilidade Gaussiana<\/strong><\/h4>\n\n\n\n<p>Uma maneira de calcular a probabilidade ou probabilidade de observar um determinado valor real \u00e9 presumir que os valores de X1 s\u00e3o extra\u00eddos de uma distribui\u00e7\u00e3o, como uma curva em forma de sino ou uma <strong>distribui\u00e7\u00e3o gaussiana<\/strong>.<\/p>\n\n\n\n<p>A <strong>probabilidade Gaussiana <\/strong>pode ser resumida usando apenas dois n\u00fameros: a m\u00e9dia e o desvio padr\u00e3o. Portanto, com um pouco de matem\u00e1tica, \u00e9 poss\u00edvel estimar a probabilidade de um determinado valor.&nbsp;<\/p>\n\n\n\n<p>Esta parte da matem\u00e1tica \u00e9 chamada de <strong>Fun\u00e7\u00e3o de Distribui\u00e7\u00e3o de Probabilidade Gaussiana<\/strong> (ou PDF Gaussiana) e pode ser calculada como:<\/p>\n\n\n\n<p><em>f(x) = (1 \/ sqrt(2 * PI) * sigma) * exp(-((x-mean)^2 \/ (2 * sigma^2)))<\/em><\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Passo 5: Probabilidades de classe<\/strong><\/h4>\n\n\n\n<p>Agora \u00e9 hora de usar as<strong> estat\u00edsticas calculadas<\/strong> a partir dos dados de treinamento para calcular as probabilidades de novos dados.<\/p>\n\n\n\n<p>Isso \u00e9 calculado separadamente para cada classe, o que significa que primeiro calculamos a probabilidade de um novo dado pertencer \u00e0 primeira classe, depois calculamos as probabilidades de ele pertencer \u00e0 segunda classe e assim por diante para todas as classes.<\/p>\n\n\n\n<p>A probabilidade de um dado pertencer a uma classe \u00e9 calculada da seguinte forma:<\/p>\n\n\n\n<p><em>P(classe|dados) = P(X|classe) * P(classe)<\/em><\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Naive Bayes e Python<\/strong><\/h3>\n\n\n\n<p>\u00c9 poss\u00edvel classificar dados no<a href=\"https:\/\/fluency.io\/br\/blog\/scikit-learn\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\"> Scikit-Learn<\/a> usando <a href=\"https:\/\/fluency.io\/br\/blog\/python-data-science\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\">Python<\/a>. Com isso, voc\u00ea pode processar os dados, treinar algoritmos de classifica\u00e7\u00e3o e avaliar cada modelo para encontrar a melhor op\u00e7\u00e3o de preditor para seus dados.\u00a0\u00a0<\/p>\n\n\n\n<p>Confira a seguir alguns passos:<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Etapa 1. Carregar dados<\/strong><\/h4>\n\n\n\n<p>Voc\u00ea pode carregar qualquer conjunto de dados rotulados que deseja prever. Por exemplo, \u00e9 poss\u00edvel usar <em>fetch_openml (&#8216;titanic&#8217;)<\/em> o conjunto de dados do Titanic para praticar.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Etapa 2. Explorar o conjunto de dados<\/strong><\/h4>\n\n\n\n<p>Use as fun\u00e7\u00f5es do<strong> python pandas<\/strong> , como <em>df.describe() e df.isnull().sum() <\/em>para descobrir como seus dados precisam ser processados \u200b\u200bantes do treinamento<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Etapa 3. Pr\u00e9-processar dados<\/strong><\/h4>\n\n\n\n<p>Solte, preencha ou atribua valores ausentes ou indesejados de seu conjunto de dados para garantir que voc\u00ea n\u00e3o introduza erros ou vieses em seus dados. Use fun\u00e7\u00f5es pandas <em>get_dummies(), drop()e fillna() <\/em>junto com algumas bibliotecas do sklearn.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Etapa 4. Dividir dados em conjunto de dados de treinamento e teste<\/strong><\/h4>\n\n\n\n<p>Para poder avaliar a precis\u00e3o de seus modelos, divida seus dados em conjuntos de treinamento e teste usando o <em>train_test_split<\/em>. Isso permitir\u00e1 treinar seus dados no conjunto de treinamento e prever e avaliar no conjunto de teste.<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Etapa 5. Crie um pipeline para treinar v\u00e1rios algoritmos de classifica\u00e7\u00e3o e hiperpar\u00e2metros<\/strong><\/h4>\n\n\n\n<p>Execute v\u00e1rios algoritmos e, para cada algoritmo, tente v\u00e1rios hiperpar\u00e2metros. Isso permitir\u00e1 encontrar o modelo de melhor desempenho e os melhores par\u00e2metros para esse modelo.&nbsp;<\/p>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>Etapa 6. Avalie o modelo de aprendizado de m\u00e1quina<\/strong><\/h4>\n\n\n\n<p>Avalie o modelo em sua precis\u00e3o e recupere com m\u00e9todos como a <em>accuracy()<\/em> ou <em>accuracy_score() <\/em>e avalie elementos como a <em>confusion_matrix()<\/em><\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Aprenda Ci\u00eancia de Dados na Awari. Conhe\u00e7a nossos cursos!<\/strong><\/h2>\n\n\n\n<p>Nossa <a href=\"https:\/\/fluency.io\/br\/blog\/trilha-de-ciencia-de-dados\/?utm_source=blog&amp;utm_medium=post\" target=\"_blank\" rel=\"noreferrer noopener\"><strong>Trilha de Data Science<\/strong><\/a><strong> <\/strong>ensina desde como coletar, manipular e tratar grandes quantidades de dados at\u00e9 criar modelos, desenvolver algoritmos, analisar tend\u00eancias e identificar insights.\u00a0A plataforma de ensino da Awari tamb\u00e9m conta com<strong> mentorias individuais<\/strong>, aulas ao vivo e suporte de carreira para voc\u00ea dar um pr\u00f3ximo passo na sua vida profissional.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>A classifica\u00e7\u00e3o de dados \u00e9 um processo crucial em Data Science, sendo bastante usado por analistas e cientistas de dados em an\u00e1lises estat\u00edsticas e ao calcular probabilidades. Nesse contexto, algoritmos como o Naive Bayes s\u00e3o um \u00f3timo exemplo de como solu\u00e7\u00f5es simples tendem a ser tamb\u00e9m as mais poderosas.\u00a0 Apesar dos \u00faltimos avan\u00e7os em Machine [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":[186],"meta":{"inline_featured_image":false,"footnotes":""},"categories":[229],"tags":[],"trilha":[],"class_list":["post-118015","post","type-post","status-publish","format-standard","hentry","category-skills","format-artigos"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v26.6 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Saiba tudo sobre Naive Bayes, um dos principais algoritmos de classifica\u00e7\u00e3o - Fluency.io Brasil<\/title>\n<meta name=\"description\" content=\"A classifica\u00e7\u00e3o de dados \u00e9 um processo crucial em Data Science, sendo bastante usado por analistas e cientistas de dados em an\u00e1lises estat\u00edsticas e ao calc...\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/\" \/>\n<meta property=\"og:locale\" content=\"pt_BR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Saiba tudo sobre Naive Bayes, um dos principais algoritmos de classifica\u00e7\u00e3o - Fluency.io Brasil\" \/>\n<meta property=\"og:description\" content=\"A classifica\u00e7\u00e3o de dados \u00e9 um processo crucial em Data Science, sendo bastante usado por analistas e cientistas de dados em an\u00e1lises estat\u00edsticas e ao calc...\" \/>\n<meta property=\"og:url\" content=\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/\" \/>\n<meta property=\"og:site_name\" content=\"Fluency.io Brasil\" \/>\n<meta property=\"article:published_time\" content=\"2022-12-09T11:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-07-26T17:11:29+00:00\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"kaue\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. tempo de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"9 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/\",\"url\":\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/\",\"name\":\"Saiba tudo sobre Naive Bayes, um dos principais algoritmos de classifica\u00e7\u00e3o - Fluency.io Brasil\",\"isPartOf\":{\"@id\":\"https:\/\/fluency.io\/br\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/O-que-e-Naive-Bayes.png\",\"datePublished\":\"2022-12-09T11:00:00+00:00\",\"dateModified\":\"2023-07-26T17:11:29+00:00\",\"author\":{\"@id\":\"https:\/\/fluency.io\/br\/#\/schema\/person\/7b3b2b50ba17b7f2ad0cce0a40bfa00a\"},\"description\":\"A classifica\u00e7\u00e3o de dados \u00e9 um processo crucial em Data Science, sendo bastante usado por analistas e cientistas de dados em an\u00e1lises estat\u00edsticas e ao calc...\",\"breadcrumb\":{\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#breadcrumb\"},\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#primaryimage\",\"url\":\"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/O-que-e-Naive-Bayes.png\",\"contentUrl\":\"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/O-que-e-Naive-Bayes.png\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"In\u00edcio\",\"item\":\"https:\/\/homolog.fluency.io\/br\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Saiba tudo sobre Naive Bayes, um dos principais algoritmos de classifica\u00e7\u00e3o\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/fluency.io\/br\/#website\",\"url\":\"https:\/\/fluency.io\/br\/\",\"name\":\"Fluency.io Brasil\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/fluency.io\/br\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pt-BR\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/fluency.io\/br\/#\/schema\/person\/7b3b2b50ba17b7f2ad0cce0a40bfa00a\",\"name\":\"kaue\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/fluency.io\/br\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/bdd3958fa53019cfd8f789c0a49a730e7ba40a1d20cb42c9ced7646285842479?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/bdd3958fa53019cfd8f789c0a49a730e7ba40a1d20cb42c9ced7646285842479?s=96&d=mm&r=g\",\"caption\":\"kaue\"},\"url\":\"https:\/\/homolog.fluency.io\/br\/author\/kaue\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Saiba tudo sobre Naive Bayes, um dos principais algoritmos de classifica\u00e7\u00e3o - Fluency.io Brasil","description":"A classifica\u00e7\u00e3o de dados \u00e9 um processo crucial em Data Science, sendo bastante usado por analistas e cientistas de dados em an\u00e1lises estat\u00edsticas e ao calc...","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/","og_locale":"pt_BR","og_type":"article","og_title":"Saiba tudo sobre Naive Bayes, um dos principais algoritmos de classifica\u00e7\u00e3o - Fluency.io Brasil","og_description":"A classifica\u00e7\u00e3o de dados \u00e9 um processo crucial em Data Science, sendo bastante usado por analistas e cientistas de dados em an\u00e1lises estat\u00edsticas e ao calc...","og_url":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/","og_site_name":"Fluency.io Brasil","article_published_time":"2022-12-09T11:00:00+00:00","article_modified_time":"2023-07-26T17:11:29+00:00","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"kaue","Est. tempo de leitura":"9 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/","url":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/","name":"Saiba tudo sobre Naive Bayes, um dos principais algoritmos de classifica\u00e7\u00e3o - Fluency.io Brasil","isPartOf":{"@id":"https:\/\/fluency.io\/br\/#website"},"primaryImageOfPage":{"@id":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#primaryimage"},"image":{"@id":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#primaryimage"},"thumbnailUrl":"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/O-que-e-Naive-Bayes.png","datePublished":"2022-12-09T11:00:00+00:00","dateModified":"2023-07-26T17:11:29+00:00","author":{"@id":"https:\/\/fluency.io\/br\/#\/schema\/person\/7b3b2b50ba17b7f2ad0cce0a40bfa00a"},"description":"A classifica\u00e7\u00e3o de dados \u00e9 um processo crucial em Data Science, sendo bastante usado por analistas e cientistas de dados em an\u00e1lises estat\u00edsticas e ao calc...","breadcrumb":{"@id":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#breadcrumb"},"inLanguage":"pt-BR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/"]}]},{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#primaryimage","url":"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/O-que-e-Naive-Bayes.png","contentUrl":"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/O-que-e-Naive-Bayes.png"},{"@type":"BreadcrumbList","@id":"https:\/\/homolog.fluency.io\/br\/blog\/naive-bayes\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"In\u00edcio","item":"https:\/\/homolog.fluency.io\/br\/"},{"@type":"ListItem","position":2,"name":"Saiba tudo sobre Naive Bayes, um dos principais algoritmos de classifica\u00e7\u00e3o"}]},{"@type":"WebSite","@id":"https:\/\/fluency.io\/br\/#website","url":"https:\/\/fluency.io\/br\/","name":"Fluency.io Brasil","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/fluency.io\/br\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pt-BR"},{"@type":"Person","@id":"https:\/\/fluency.io\/br\/#\/schema\/person\/7b3b2b50ba17b7f2ad0cce0a40bfa00a","name":"kaue","image":{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/fluency.io\/br\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/bdd3958fa53019cfd8f789c0a49a730e7ba40a1d20cb42c9ced7646285842479?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/bdd3958fa53019cfd8f789c0a49a730e7ba40a1d20cb42c9ced7646285842479?s=96&d=mm&r=g","caption":"kaue"},"url":"https:\/\/homolog.fluency.io\/br\/author\/kaue\/"}]}},"_links":{"self":[{"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/posts\/118015","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/comments?post=118015"}],"version-history":[{"count":0,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/posts\/118015\/revisions"}],"wp:attachment":[{"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/media?parent=118015"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/categories?post=118015"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/tags?post=118015"},{"taxonomy":"format","embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/format?post=118015"},{"taxonomy":"trilha","embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/trilha?post=118015"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}