Популярное

Музыка Кино и Анимация Автомобили Животные Спорт Путешествия Игры Юмор

Интересные видео

2025 Сериалы Трейлеры Новости Как сделать Видеоуроки Diy своими руками

Топ запросов

смотреть а4 schoolboy runaway турецкий сериал смотреть мультфильмы эдисон
dTub
Скачать

23. Aula 23 - Clusterização no R

Автор: Professor Máiron Chaves

Загружено: 2025-01-29

Просмотров: 229

Описание:

📊 Resumo do Vídeo: "Curso Ciência de Dados - Do Zero ao Iniciante (Aula 23: Clusterização no R)"
Nesta aula prática, StatiR apresenta como implementar clusterização no R, utilizando o algoritmo K-Means e abordando as etapas de preparação de dados, normalização e visualização dos clusters. A aula é voltada para a aplicação prática e interpretação dos resultados.

🛠️ 1. Configuração Inicial
Carregamento do Dataset:

O dataset utilizado contém dados de mamíferos e suas características, como percentual de água, proteína e lactose no leite.
A base é carregada e manipulada no R para remoção de colunas irrelevantes (ex.: nomes dos animais).
Normalização:

Por que não foi necessária?
Todas as variáveis estão em percentuais, já padronizadas.
Caso necessário:
O comando scale() pode ser usado para normalizar as variáveis com unidades diferentes.
📐 2. Cálculo da Distância
Distância Euclidiana:

Usada para medir a proximidade entre os pontos no dataset.
O comando dist() é utilizado para gerar a matriz de distâncias, que é a base para o algoritmo K-Means.
Exemplo:

Cada ponto (animal) é comparado com todos os outros para calcular as distâncias e determinar os grupos.
🌟 3. Implementação do K-Means
Definição de K:

O número de clusters é definido pelo usuário (ex.: K = 3).
Execução no R:

O comando kmeans() é usado para rodar o algoritmo.
Exemplo:
R
Copiar código
modelo = kmeans(dados, centers = 3)
O resultado inclui:
Centroides: Representam a média das variáveis em cada cluster.
Alocação: Atribuição de cada ponto ao seu cluster mais próximo.

📈 4. Validação dos Clusters
Visualização com PCA:

Para facilitar a interpretação, o PCA é usado para reduzir a dimensionalidade dos dados.
Os clusters são plotados em duas dimensões, com cada cluster identificado por uma cor.
Interpretação Gráfica:

Se os pontos de um cluster estão bem separados dos outros, o modelo é considerado eficiente.
Medidas estatísticas, como o método do cotovelo, podem ser usadas para ajustar o número de clusters.

🚀 Aprofundando com Inspiração Prática
Desafie-se: Aplique o K-Means em um novo dataset e use o método do cotovelo para encontrar o número ideal de clusters.
PCA em Ação: Explore como diferentes combinações de variáveis afetam a separação dos clusters.
Impacto Real: Imagine como agrupar consumidores ou perfis de clientes pode ser aplicado em projetos reais de marketing ou recomendação.

23. Aula 23 - Clusterização no R

Поделиться в:

Доступные форматы для скачивания:

Скачать видео mp4

  • Информация по загрузке:

Скачать аудио mp3

Похожие видео

24. Aula 24 - Regras de Associação: Algoritmo Apriori

24. Aula 24 - Regras de Associação: Algoritmo Apriori

22. Aula 22 - Clusterização Não Hierárquica

22. Aula 22 - Clusterização Não Hierárquica

ЮНИ-Центр Понедельник 2025 Теория алгоритмов

ЮНИ-Центр Понедельник 2025 Теория алгоритмов

18. Aula 18 - Regressão com o R (parte 1 de 2)

18. Aula 18 - Regressão com o R (parte 1 de 2)

Curso: Ciência de Dados - Do Zero a Iniciante

Curso: Ciência de Dados - Do Zero a Iniciante

5 операций, которые я, как врач, НИКОГДА бы не сделал! / Вы ПОЖАЛЕЕТЕ об ЭТИХ операциях!

5 операций, которые я, как врач, НИКОГДА бы не сделал! / Вы ПОЖАЛЕЕТЕ об ЭТИХ операциях!

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

LLM и GPT - как работают большие языковые модели? Визуальное введение в трансформеры

Usando o ComplexHeatmap para TURBINAR seu DENDROGRAMA ou CLUSTER do R e RStudio

Usando o ComplexHeatmap para TURBINAR seu DENDROGRAMA ou CLUSTER do R e RStudio

Николай Платошкин про планы Трампа на Гренландию

Николай Платошкин про планы Трампа на Гренландию

13. Aula 13 - Avaliando as Predições de um Classificador

13. Aula 13 - Avaliando as Predições de um Classificador

Clusterização de dados no R - K means

Clusterização de dados no R - K means

🔴🔴🔵🔵 Dendrograma / Agrupamento / Cluster explicadinho e mastigado com exemplo bem prático e simples.

🔴🔴🔵🔵 Dendrograma / Agrupamento / Cluster explicadinho e mastigado com exemplo bem prático e simples.

Если у тебя спросили «Как твои дела?» — НЕ ГОВОРИ! Ты теряешь свою силу | Еврейская мудрость

Если у тебя спросили «Как твои дела?» — НЕ ГОВОРИ! Ты теряешь свою силу | Еврейская мудрость

1. Aula 1 - O que é Ciência de Dados? Para que serve?

1. Aula 1 - O que é Ciência de Dados? Para que serve?

Aula 6.0: Analise Multivariada: Componentes principais

Aula 6.0: Analise Multivariada: Componentes principais

Самый сложный экзамен в мире: как простолюдин в Китае мог стать министром?! #китай #экзамен #история

Самый сложный экзамен в мире: как простолюдин в Китае мог стать министром?! #китай #экзамен #история

30 самых прекрасных классических произведений для души и сердца 🎵 Моцарт, Бах, Бетховен, Шопен

30 самых прекрасных классических произведений для души и сердца 🎵 Моцарт, Бах, Бетховен, Шопен

Хирурги мне этого не простят. 10 операций, которые калечат после 55

Хирурги мне этого не простят. 10 операций, которые калечат после 55

Introdução à análise de agrupamento (cluster analysis)

Introdução à análise de agrupamento (cluster analysis)

12. Aula 12 - Algoritmo KNN

12. Aula 12 - Algoritmo KNN

© 2025 dtub. Все права защищены.



  • Контакты
  • О нас
  • Политика конфиденциальности



Контакты для правообладателей: infodtube@gmail.com