{"id":117993,"date":"2022-12-07T08:00:00","date_gmt":"2022-12-07T11:00:00","guid":{"rendered":"https:\/\/fluency.io\/br\/blog\/?p=14438"},"modified":"2023-07-26T14:11:27","modified_gmt":"2023-07-26T17:11:27","slug":"clusterizacao-de-dados","status":"publish","type":"post","link":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/","title":{"rendered":"Clusteriza\u00e7\u00e3o de Dados: entenda esse m\u00e9todo de an\u00e1lise para Data Science"},"content":{"rendered":"\n<p>Mesmo que a gente sequer perceba, muitos aspectos da nossa vida envolvem classificar ou agrupar coisas. Seja na organiza\u00e7\u00e3o pessoal, nas prateleiras de supermercado, ao organizar a estante de livros, ou simplesmente ao colocar objetos similares dentro de uma mesma ordem. No caso de <a href=\"https:\/\/fluency.io\/br\/blog\/o-que-e-data-science\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\"><strong>Data Science<\/strong><\/a>, isso n\u00e3o \u00e9 muito diferente.\u00a0<\/p>\n\n\n\n<p>Um dos principais m\u00e9todos de an\u00e1lise usado por <a href=\"https:\/\/fluency.io\/br\/blog\/diferenca-analista-cientista-dados\/?utm_source=blog&amp;utm_medium=post\" target=\"_blank\" rel=\"noreferrer noopener\"><strong>cientistas de dados <\/strong><\/a>\u00e9 chamado de Clusteriza\u00e7\u00e3o. Tal t\u00e9cnica consiste justamente em agrupar <strong>conjuntos de dados<\/strong> similares entre si e, assim, conseguir definir e avaliar padr\u00f5es. Tudo isso a partir de algoritmos de<strong> <\/strong><a href=\"https:\/\/fluency.io\/br\/blog\/machine-learning\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\"><strong>Machine Learning (ML)<\/strong><\/a>.<\/p>\n\n\n\n<p>Abordaremos neste post uma vis\u00e3o geral dessa t\u00e9cnica, suas vantagens e desvantagens, assim como por que a <strong>Clusteriza\u00e7\u00e3o de Dados<\/strong> \u00e9 t\u00e3o importante. Confira:<\/p>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>O que \u00e9 clusteriza\u00e7\u00e3o de dados?<\/strong><\/h2>\n\n\n\n<p><strong>Clusteriza\u00e7\u00e3o de Dados<\/strong>, ou simplesmente <strong>Clustering<\/strong>, \u00e9 uma t\u00e9cnica de <strong>minera\u00e7\u00e3o de dados<\/strong>, baseada em <a href=\"https:\/\/fluency.io\/br\/blog\/scikit-learn\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\"><strong>Aprendizado de M\u00e1quina<\/strong><\/a>, usada para dividir conjuntos de dados em grupos (clusters), de modo que os <strong>pontos de dados<\/strong> dentro desse grupo tenham alta similaridade entre si, mas sejam diferentes dos pontos em outros grupos.\u00a0<\/p>\n\n\n\n<p>Em outras palavras, trata-se do <strong>agrupamento de dados<\/strong> a partir de uma <a href=\"https:\/\/fluency.io\/br\/blog\/algoritmos-de-classificacao\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\"><strong>classifica\u00e7\u00e3o n\u00e3o supervisionada<\/strong><\/a> de padr\u00f5es (observa\u00e7\u00f5es, itens de dados ou vetores de recursos). Cada cluster consiste em <strong>objetos de dados<\/strong> com alta inter-similaridade e baixa intra-similaridade.<\/p>\n\n\n\n<p>A <strong>an\u00e1lise de cluster <\/strong>em si<strong> <\/strong>n\u00e3o pode ser considerada um algoritmo espec\u00edfico, mas sim uma tarefa geral a ser resolvida. Isso pode ser alcan\u00e7ado por v\u00e1rios algoritmos que diferem em sua compreens\u00e3o do que constitui um cluster e como localiz\u00e1-los com efici\u00eancia.&nbsp;<\/p>\n\n\n\n<p>Portanto, a <strong>Clusteriza\u00e7\u00e3o de Dados <\/strong>n\u00e3o \u00e9 uma tarefa autom\u00e1tica. Na verdade, ela tem mais a ver com um <strong>processo iterativo<\/strong> de descoberta de conhecimento ou otimiza\u00e7\u00e3o multiobjetivo interativa que envolve tentativa e falha. Por isso, muitas vezes \u00e9 necess\u00e1rio modificar o <strong>pr\u00e9-processamento de dados<\/strong> e os <strong>par\u00e2metros de modelos<\/strong> at\u00e9 que o resultado atinja as propriedades desejadas.<\/p>\n\n\n\n<p>Tais modelos se distinguem por sua organiza\u00e7\u00e3o e tipo de relacionamento entre eles. Os mais importantes s\u00e3o:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Centroid-based (centralizado):<\/strong> cada cluster \u00e9 representado por um \u00fanico vetor m\u00e9dio, e um valor de objeto \u00e9 comparado a esses valores m\u00e9dios;<\/li>\n\n\n\n<li><strong>Distribution-based (distribu\u00eddo):<\/strong> o cluster \u00e9 constru\u00eddo usando distribui\u00e7\u00f5es estat\u00edsticas;<\/li>\n\n\n\n<li><strong>Density-based (densidade):<\/strong> os membros do cluster s\u00e3o agrupados por regi\u00f5es onde as observa\u00e7\u00f5es s\u00e3o densas e semelhantes.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Quais s\u00e3o as aplica\u00e7\u00f5es da clusteriza\u00e7\u00e3o de dados?<\/strong><\/h3>\n\n\n\n<p>O <strong>m\u00e9todo de Clusteriza\u00e7\u00e3o<\/strong> \u00e9 aplicado em v\u00e1rios campos para preparar os dados para v\u00e1rios processos de <strong>Machine Learning<\/strong>, incluindo <strong>pesquisas de mercado<\/strong>, reconhecimento de padr\u00f5es, assim como no processamento de dados e imagens, justamente por possibilitar a an\u00e1lise e agrupamento de um grande <strong>volume de dados<\/strong>.&nbsp;<\/p>\n\n\n\n<p>Considerando <strong>dados de compras<\/strong> online, por exemplo, essa t\u00e9cnica permite identificar clientes que possuem um determinado hist\u00f3rico e conduta semelhantes (isto \u00e9, <strong>padr\u00f5es de compra<\/strong>). Isso pode ajudar anunciantes a encontrar diferentes grupos em sua base de clientes.&nbsp;<\/p>\n\n\n\n<p>Existem diversas formas de implementar esse particionamento, baseadas em modelos distintos. Ou seja, diferentes algoritmos s\u00e3o aplicados a cada modelo, diferenciando suas propriedades e resultados.&nbsp;<\/p>\n\n\n\n<p>Algumas das aplica\u00e7\u00f5es da<strong> clusteriza\u00e7\u00e3o de dados<\/strong> s\u00e3o as seguintes:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Processamento de dados e pondera\u00e7\u00e3o de recursos:<\/strong> os dados podem ser representados como IDs de cluster e acessados \u200b\u200busando data, hora e dados demogr\u00e1ficos. Isso economiza armazenamento e simplifica os dados do recurso;<\/li>\n\n\n\n<li><strong>Segmenta\u00e7\u00e3o de mercado:<\/strong> as empresas precisam segmentar seu mercado em grupos menores para entender o p\u00fablico-alvo. Nesse caso, a clusteriza\u00e7\u00e3o agrupa as pessoas com ideias semelhantes para gerar recomenda\u00e7\u00f5es semelhantes e ajuda na constru\u00e7\u00e3o de padr\u00f5es e no desenvolvimento de insights;<\/li>\n\n\n\n<li><strong>Marketing e vendas no varejo:<\/strong> o marketing utiliza o clustering para entender o comportamento de compra dos clientes e regular a cadeia de suprimentos e as recomenda\u00e7\u00f5es, uma vez que esse m\u00e9todo permite agrupar pessoas com caracter\u00edsticas e probabilidade de compra semelhantes. Isso ajuda a atingir os segmentos de clientes apropriados e oferece promo\u00e7\u00f5es eficazes;<\/li>\n\n\n\n<li><strong>An\u00e1lise de redes sociais:<\/strong> a clusteriza\u00e7\u00e3o \u00e9 necess\u00e1ria para observar a intera\u00e7\u00e3o entre os usu\u00e1rios para adquirir insights sobre v\u00e1rios pap\u00e9is e agrupamentos na rede, examinando arranjos sociais qualitativos e quantitativos usando rede e Teoria dos Grafos;<\/li>\n\n\n\n<li><strong>An\u00e1lise de rede sem fio ou classifica\u00e7\u00e3o de tr\u00e1fego de rede: <\/strong>Clustering agrupa caracter\u00edsticas das fontes de tr\u00e1fego de rede. Clusters s\u00e3o formados para classificar os tipos de tr\u00e1fego. Ter informa\u00e7\u00f5es precisas sobre as fontes de tr\u00e1fego ajuda a aumentar o tr\u00e1fego do site e planejar a capacidade de forma eficaz.<\/li>\n\n\n\n<li><strong>Compress\u00e3o de imagem: <\/strong>o clustering ajuda a armazenar as imagens em um formato compactado ao reduzi-las de tamanho sem comprometer a qualidade;<\/li>\n\n\n\n<li><strong>Regula\u00e7\u00e3o de servi\u00e7os de streaming: <\/strong>tem a ver com a identifica\u00e7\u00e3o de espectadores com comportamento e interesses semelhantes. Netflix e outras plataformas OTT agrupam seus usu\u00e1rios com base em par\u00e2metros como g\u00eanero, minutos assistidos por dia e sess\u00f5es totais de visualiza\u00e7\u00e3o para agrup\u00e1-los de acordo com padr\u00f5es de alto e baixo uso. Isso ajuda a colocar an\u00fancios e recomenda\u00e7\u00f5es mais relevantes para os usu\u00e1rios.<\/li>\n\n\n\n<li><strong>Sugest\u00f5es de marca\u00e7\u00e3o usando co-ocorr\u00eancia:<\/strong> a clusteriza\u00e7\u00e3o ajuda a entender o comportamento de pesquisas ao tague\u00e1-las em caso de&nbsp; repeti\u00e7\u00e3o. Esse processo consiste em tomar uma entrada para um conjunto de dados e manter um log cada vez que a palavra-chave for pesquisada, assim como o n\u00famero de vezes que duas tags aparecem. Isso geralmente \u00e9 feito usando alguma m\u00e9trica de similaridade;<\/li>\n\n\n\n<li><strong>Identifica\u00e7\u00e3o de conte\u00fado bom ou ruim: <\/strong>o clustering serve tamb\u00e9m para filtrar not\u00edcias falsas e detectar fraudes, spam ou conte\u00fado impr\u00f3prio usando atributos como fonte, palavras-chave e conte\u00fado.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Por que esse m\u00e9todo \u00e9 t\u00e3o importante?<\/strong><\/h3>\n\n\n\n<p>A <strong>Clusteriza\u00e7\u00e3o de Dados<\/strong> desempenha um papel fundamental no campo da <a href=\"https:\/\/fluency.io\/br\/blog\/analise-de-dados\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\">minera\u00e7\u00e3o e an\u00e1lise de dados <\/a>por ter enorme aplicabilidade. Esse m\u00e9todo de an\u00e1lise \u00e9 capaz de abordar com efici\u00eancia diversos problemas e objetivos, dos mais simples aos mais complexos.<\/p>\n\n\n\n<p>Algumas das raz\u00f5es de que justificam a import\u00e2ncia deste m\u00e9todo s\u00e3o:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Identifica\u00e7\u00e3o de padr\u00f5es: <\/strong>a clusteriza\u00e7\u00e3o de dados permite que cientistas e profissionais de dados saibam com o que est\u00e3o lidando, uma vez que ajuda a identificar e mapear diferentes situa\u00e7\u00f5es ao classific\u00e1-las usando padr\u00f5es;<\/li>\n\n\n\n<li><strong>Maior efici\u00eancia na an\u00e1lise de dados: <\/strong>por ser feita a partir de padr\u00f5es, t\u00e9cnicas do tipo clustering tornam a an\u00e1lise de dados mais focada e precisa;&nbsp;<\/li>\n\n\n\n<li><strong>Elabora\u00e7\u00e3o de estrat\u00e9gias baseadas em dados: <\/strong>a clusteriza\u00e7\u00e3o possibilita criar estrat\u00e9gias diferenciadas para cada um dos clusters, com objetivos, a\u00e7\u00f5es e metas espec\u00edficas.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Qual a diferen\u00e7a entre classifica\u00e7\u00e3o e clusteriza\u00e7\u00e3o?<\/strong><\/h3>\n\n\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"310\" src=\"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1024x310.png\" alt=\"imagem mostrando graficamente a diferen\u00e7a entre classifica\u00e7\u00e3o e clustariza\u00e7\u00e3o\" class=\"wp-image-14439\" srcset=\"https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1024x310.png 1024w, https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-949x287.png 949w, https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-768x233.png 768w, https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1536x465.png 1536w, https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1027x311.png 1027w, https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-515x156.png 515w, https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-150x45.png 150w, https:\/\/homolog.fluency.io\/br\/wp-content\/uploads\/sites\/3\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao.png 1625w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\">Enquanto na Classifica\u00e7\u00e3o existem r\u00f3tulos predefinidos atribu\u00eddos a cada inst\u00e2ncia de entrada, na Clusteriza\u00e7\u00e3o esses r\u00f3tulos n\u00e3o aparecem. Imagem: <a href=\"https:\/\/www.analyticsvidhya.com\/blog\/2021\/11\/quick-tutorial-clustering-data-science\/\">analyticsvidhya.com<\/a><\/figcaption><\/figure>\n\n\n\n<p>Tanto <strong>Classifica\u00e7\u00e3o<\/strong> quanto <strong>Clusteriza\u00e7\u00e3o<\/strong> consistem em m\u00e9todos de identifica\u00e7\u00e3o de padr\u00f5es usados em <strong>Machine Learning<\/strong>.&nbsp;<\/p>\n\n\n\n<p>Contudo, embora ambas essas t\u00e9cnicas tenham l\u00e1 suas semelhan\u00e7as, a maior diferen\u00e7a entre elas reside no fato de que a classifica\u00e7\u00e3o utiliza <strong>classes pr\u00e9-definidas<\/strong> nas quais os objetos s\u00e3o atribu\u00eddos.&nbsp;<\/p>\n\n\n\n<p>Enquanto isso, o clustering identifica <strong>semelhan\u00e7as entre objetos<\/strong>, agrupando-os de acordo com essas caracter\u00edsticas em comum e que os diferenciam de outros grupos de objetos (clusters)<\/p>\n\n\n\n<p>O clustering \u00e9 utilizado para encontrar aspectos comuns entre determinados conjuntos de dados, sendo muito adotado por empresas para identificar aspectos comuns entre clientes e segment\u00e1-los.&nbsp;<\/p>\n\n\n\n<p>J\u00e1 a Classifica\u00e7\u00e3o, por outro lado, pertence ao <strong>aprendizado supervisionado<\/strong>, o que significa que conhecemos os dados de entrada (rotulados neste caso) e conhecemos a poss\u00edvel sa\u00edda do algoritmo. Al\u00e9m disso, esse m\u00e9todo costuma ser mais usado em campos como biologia e na detec\u00e7\u00e3o de spam em e-mails.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\"><strong>Vantagens e Desvantagens da Clusteriza\u00e7\u00e3o de dados<\/strong><\/h3>\n\n\n\n<p>Conhe\u00e7a a seguir algumas das principais vantagens da clusteriza\u00e7\u00e3o:&nbsp;&nbsp;<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Escalabilidade: <\/strong>\u00e0 medida que sua base de dados cresce e a complexidade dos relat\u00f3rios aumenta, \u00e9 poss\u00edvel adicionar recursos ao cluster posteriormente;<\/li>\n\n\n\n<li><strong>Gerenciamento simplificado<\/strong>:a clusteriza\u00e7\u00e3o simplifica o gerenciamento de sistemas grandes ou em r\u00e1pido crescimento;<\/li>\n\n\n\n<li><strong>Confiabilidade: <\/strong>clustering ocupa um lugar especial por ser confi\u00e1vel e f\u00e1cil de configurar. Caso um servidor esteja tendo problemas, outros servidores no cluster podem assumir a carga. Isso evita a perda de tempo e informa\u00e7\u00f5es valiosas se um servidor falhar.<\/li>\n\n\n\n<li><strong>Maior desempenho: <\/strong>m\u00faltiplas m\u00e1quinas fornecem maior poder de processamento;<\/li>\n\n\n\n<li><strong>Viabilidade: <\/strong>a divis\u00e3o de objetos ou conjuntos de dados em grupos homog\u00eaneos aumenta a viabilidade da an\u00e1lise de dados. Al\u00e9m disso, uma vez que cada cluster representa o todo, mais objetos podem ser inclu\u00eddos depois.<\/li>\n<\/ul>\n\n\n\n<p>J\u00e1 entre os desvantagens por tr\u00e1s da ado\u00e7\u00e3o desse m\u00e9todo est\u00e3o:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Alto custo: <\/strong>como o clustering precisa de v\u00e1rios servidores e hardware para se estabelecer, o monitoramento e a manuten\u00e7\u00e3o tendem a ser dif\u00edceis e caros, o que faz aumentar o investimento em infra-estrutura;<\/li>\n\n\n\n<li><strong>Sensibilidade:<\/strong> pode haver alta sensibilidade \u00e0 fase de inicializa\u00e7\u00e3o, ru\u00eddo e outliers durante o processo de clusteriza\u00e7\u00e3o;<\/li>\n\n\n\n<li><strong>Recupera\u00e7\u00e3o de dados: <\/strong>incapacidade de recupera\u00e7\u00e3o caso os dados sejam corrompidos durante o processo;<\/li>\n\n\n\n<li><strong>Alto erro de amostragem: <\/strong>geralmente, as amostras extra\u00eddas usando o m\u00e9todo de clusteriza\u00e7\u00e3o s\u00e3o propensas a erros de amostragem mais altos do que as amostras formadas usando outros m\u00e9todos.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading\"><strong>Como aprender mais sobre Data Science?<\/strong><\/h2>\n\n\n\n<p>Se voc\u00ea chegou at\u00e9 aqui, provavelmente est\u00e1 interessado em aprender mais sobre<strong> <\/strong><a href=\"https:\/\/fluency.io\/br\/blog\/tudo-sobre-ciencia-de-dados\/?utm_source=blog\" target=\"_blank\" rel=\"noreferrer noopener\"><strong>Ci\u00eancia de Dados<\/strong><\/a> e seus m\u00e9todos.\u00a0<\/p>\n\n\n\n<p>Aqui vai uma sugest\u00e3o: conhe\u00e7a nossa <a href=\"https:\/\/fluency.io\/br\/blog\/trilha-de-ciencia-de-dados\/?utm_source=blog&amp;utm_medium=post\" target=\"_blank\" rel=\"noreferrer noopener\"><strong>Trilha de Data Science<\/strong><\/a>! Nela, voc\u00ea ir\u00e1 aprender desde como coletar, manipular e tratar grandes quantidades de dados at\u00e9 criar modelos, desenvolver algoritmos, analisar tend\u00eancias e identificar insights.\u00a0Al\u00e9m disso, a plataforma de ensino da Awari tamb\u00e9m conta com<strong> mentorias individuais<\/strong>, aulas ao vivo e suporte de carreira para voc\u00ea dar um pr\u00f3ximo passo na sua vida profissional.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Mesmo que a gente sequer perceba, muitos aspectos da nossa vida envolvem classificar ou agrupar coisas. Seja na organiza\u00e7\u00e3o pessoal, nas prateleiras de supermercado, ao organizar a estante de livros, ou simplesmente ao colocar objetos similares dentro de uma mesma ordem. No caso de Data Science, isso n\u00e3o \u00e9 muito diferente.\u00a0 Um dos principais m\u00e9todos [&hellip;]<\/p>\n","protected":false},"author":9,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":[186],"meta":{"inline_featured_image":false,"footnotes":""},"categories":[229],"tags":[],"trilha":[],"class_list":["post-117993","post","type-post","status-publish","format-standard","hentry","category-skills","format-artigos"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v26.6 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Clusteriza\u00e7\u00e3o de Dados: entenda esse m\u00e9todo de an\u00e1lise para Data Science - Fluency.io Brasil<\/title>\n<meta name=\"description\" content=\"Mesmo que a gente sequer perceba, muitos aspectos da nossa vida envolvem classificar ou agrupar coisas. Seja na organiza\u00e7\u00e3o pessoal, nas prateleiras de sup...\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/\" \/>\n<meta property=\"og:locale\" content=\"pt_BR\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Clusteriza\u00e7\u00e3o de Dados: entenda esse m\u00e9todo de an\u00e1lise para Data Science - Fluency.io Brasil\" \/>\n<meta property=\"og:description\" content=\"Mesmo que a gente sequer perceba, muitos aspectos da nossa vida envolvem classificar ou agrupar coisas. Seja na organiza\u00e7\u00e3o pessoal, nas prateleiras de sup...\" \/>\n<meta property=\"og:url\" content=\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/\" \/>\n<meta property=\"og:site_name\" content=\"Fluency.io Brasil\" \/>\n<meta property=\"article:published_time\" content=\"2022-12-07T11:00:00+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2023-07-26T17:11:27+00:00\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"kaue\" \/>\n\t<meta name=\"twitter:label2\" content=\"Est. tempo de leitura\" \/>\n\t<meta name=\"twitter:data2\" content=\"9 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/\",\"url\":\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/\",\"name\":\"Clusteriza\u00e7\u00e3o de Dados: entenda esse m\u00e9todo de an\u00e1lise para Data Science - Fluency.io Brasil\",\"isPartOf\":{\"@id\":\"https:\/\/fluency.io\/br\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1024x310.png\",\"datePublished\":\"2022-12-07T11:00:00+00:00\",\"dateModified\":\"2023-07-26T17:11:27+00:00\",\"author\":{\"@id\":\"https:\/\/fluency.io\/br\/#\/schema\/person\/7b3b2b50ba17b7f2ad0cce0a40bfa00a\"},\"description\":\"Mesmo que a gente sequer perceba, muitos aspectos da nossa vida envolvem classificar ou agrupar coisas. Seja na organiza\u00e7\u00e3o pessoal, nas prateleiras de sup...\",\"breadcrumb\":{\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#breadcrumb\"},\"inLanguage\":\"pt-BR\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#primaryimage\",\"url\":\"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1024x310.png\",\"contentUrl\":\"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1024x310.png\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"In\u00edcio\",\"item\":\"https:\/\/homolog.fluency.io\/br\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Clusteriza\u00e7\u00e3o de Dados: entenda esse m\u00e9todo de an\u00e1lise para Data Science\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/fluency.io\/br\/#website\",\"url\":\"https:\/\/fluency.io\/br\/\",\"name\":\"Fluency.io Brasil\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/fluency.io\/br\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"pt-BR\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/fluency.io\/br\/#\/schema\/person\/7b3b2b50ba17b7f2ad0cce0a40bfa00a\",\"name\":\"kaue\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"pt-BR\",\"@id\":\"https:\/\/fluency.io\/br\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/bdd3958fa53019cfd8f789c0a49a730e7ba40a1d20cb42c9ced7646285842479?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/bdd3958fa53019cfd8f789c0a49a730e7ba40a1d20cb42c9ced7646285842479?s=96&d=mm&r=g\",\"caption\":\"kaue\"},\"url\":\"https:\/\/homolog.fluency.io\/br\/author\/kaue\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Clusteriza\u00e7\u00e3o de Dados: entenda esse m\u00e9todo de an\u00e1lise para Data Science - Fluency.io Brasil","description":"Mesmo que a gente sequer perceba, muitos aspectos da nossa vida envolvem classificar ou agrupar coisas. Seja na organiza\u00e7\u00e3o pessoal, nas prateleiras de sup...","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/","og_locale":"pt_BR","og_type":"article","og_title":"Clusteriza\u00e7\u00e3o de Dados: entenda esse m\u00e9todo de an\u00e1lise para Data Science - Fluency.io Brasil","og_description":"Mesmo que a gente sequer perceba, muitos aspectos da nossa vida envolvem classificar ou agrupar coisas. Seja na organiza\u00e7\u00e3o pessoal, nas prateleiras de sup...","og_url":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/","og_site_name":"Fluency.io Brasil","article_published_time":"2022-12-07T11:00:00+00:00","article_modified_time":"2023-07-26T17:11:27+00:00","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"kaue","Est. tempo de leitura":"9 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/","url":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/","name":"Clusteriza\u00e7\u00e3o de Dados: entenda esse m\u00e9todo de an\u00e1lise para Data Science - Fluency.io Brasil","isPartOf":{"@id":"https:\/\/fluency.io\/br\/#website"},"primaryImageOfPage":{"@id":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#primaryimage"},"image":{"@id":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#primaryimage"},"thumbnailUrl":"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1024x310.png","datePublished":"2022-12-07T11:00:00+00:00","dateModified":"2023-07-26T17:11:27+00:00","author":{"@id":"https:\/\/fluency.io\/br\/#\/schema\/person\/7b3b2b50ba17b7f2ad0cce0a40bfa00a"},"description":"Mesmo que a gente sequer perceba, muitos aspectos da nossa vida envolvem classificar ou agrupar coisas. Seja na organiza\u00e7\u00e3o pessoal, nas prateleiras de sup...","breadcrumb":{"@id":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#breadcrumb"},"inLanguage":"pt-BR","potentialAction":[{"@type":"ReadAction","target":["https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/"]}]},{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#primaryimage","url":"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1024x310.png","contentUrl":"https:\/\/fluency.io\/br\/blog\/wp-content\/uploads\/2022\/12\/Qual-a-diferenca-entre-classificacao-e-clusterizacao-1024x310.png"},{"@type":"BreadcrumbList","@id":"https:\/\/homolog.fluency.io\/br\/blog\/clusterizacao-de-dados\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"In\u00edcio","item":"https:\/\/homolog.fluency.io\/br\/"},{"@type":"ListItem","position":2,"name":"Clusteriza\u00e7\u00e3o de Dados: entenda esse m\u00e9todo de an\u00e1lise para Data Science"}]},{"@type":"WebSite","@id":"https:\/\/fluency.io\/br\/#website","url":"https:\/\/fluency.io\/br\/","name":"Fluency.io Brasil","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/fluency.io\/br\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"pt-BR"},{"@type":"Person","@id":"https:\/\/fluency.io\/br\/#\/schema\/person\/7b3b2b50ba17b7f2ad0cce0a40bfa00a","name":"kaue","image":{"@type":"ImageObject","inLanguage":"pt-BR","@id":"https:\/\/fluency.io\/br\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/bdd3958fa53019cfd8f789c0a49a730e7ba40a1d20cb42c9ced7646285842479?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/bdd3958fa53019cfd8f789c0a49a730e7ba40a1d20cb42c9ced7646285842479?s=96&d=mm&r=g","caption":"kaue"},"url":"https:\/\/homolog.fluency.io\/br\/author\/kaue\/"}]}},"_links":{"self":[{"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/posts\/117993","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/users\/9"}],"replies":[{"embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/comments?post=117993"}],"version-history":[{"count":0,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/posts\/117993\/revisions"}],"wp:attachment":[{"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/media?parent=117993"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/categories?post=117993"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/tags?post=117993"},{"taxonomy":"format","embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/format?post=117993"},{"taxonomy":"trilha","embeddable":true,"href":"https:\/\/homolog.fluency.io\/br\/wp-json\/wp\/v2\/trilha?post=117993"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}