MENU

| BR

Campus

Cursos

Programas Executivos

Programas Executivos

Paises

Máquina de vetores de suporte: o que é?

Máquina de vetores de suporte: o que é?
#Dados
23 de julho - min de leitura

Entenda o que é máquina de vetores de suporte e porque esse modelo é tão importante para um data scientist e para o mercado atual.


O tema de hoje sucede outro importante modelo de classificação em aprendizado supervisionado, o Naïve Bayes. Classificador probabilístico baseados na aplicação do teorema de Bayes, o Naïve Bayes supõe a independência entre os atributos. Por ser simples e rápido o Naïve Bayes está entre os modelos mais aplicados para a classificação. Modelos de classificação têm aplicações diversas na sociedade moderna, da análise de sentimentos à classificação de documentos. A seguir apresentamos mais um interessante modelo, o Support Vector Machine.

Support Vector Machine. 

As Máquinas de Vetores de Suporte ou Support Vector Machines, como o algoritmo é conhecido, são ferramentas de classificação e regressão. Uma SVM constrói hiperplanos em um espaço n-dimensional para classificar ou regredir dados.

 


Os vetores de suporte de classificação constituem o SVC e os vetores de suporte de regressão constituem o SVR. Como ambos dependem apenas de um subconjunto dos dados de treinamento, pois a função de custo que constrói modelo não considera os pontos de treinamento que estão distantes da margem de classificação, o regressor se torna uma extensão do modelo de classificação. Nesse artigo concentraremos nossa atenção na propriedade de classificação que as máquinas de suporte nos oferecem.

Conhecido como Support Vector Classification (SVC), o classificador SVC é uma ferramenta que usufrui das diferenças de posição entre determinadas observações e de sua disposição no espaço de atributos, determinado por um dataset, para classificar os pontos observados em relação as suas classes. A ideia é encontrar um objeto geométrico separador de classes, que pode ser uma linha em um espaço bidimensional, um plano em um espaço tridimensional ou um hiperplano, em um espaço n-dimensional de atributos.

O método dos vetores de suporte é aplicável a áreas tão diversas quanto a detecção facial e classificação de imagens, a categorização de textos e hipertextos e reconhecimento de letras manuscritas, até a detecção de anomalias.

Considere a seguinte base dados apresentada na figura a seguir, com um número M de observações, dois atributos, A e B , e um rótulo que se divide entre as classes Cruz Azul e Círculo Vermelho. 

  

Quando visualizamos os dados de nosso dataset no espaço definido pelos atributos A e B, vemos que sua disposição ocorre de maneira a termos dois agrupamentos, um de Círculos Vermelhos e um de Cruzes Azuis. A figura a seguir apresenta essa disposição espacial das observações. À esquerda vemos a dispersão dos pontos e, à direita, vemos como atua o método SVC de classificação.  

 


Note à direita, que os pontos mais próximos da fronteira entre os dois agrupamentos são utilizados como suporte para a criação de uma linha separadora de classificação. Esses pontos formam nossos vetores de suporte, tanto do lado dos Círculos Vermelhos, quanto do lado das Cruzes azuis e não é necessário que o mesmo número de pontos seja adotado em cada vetor de suporte. São esses pontos que fornecem suporte para a linha separadora, influenciando sua posição. A distância entre os pontos de ambas as classes caracteriza a margem que otimiza o processo de classificação. Como o SVC usa distâncias espaciais para realizar sua classificação, pode ser importante considerar o uso de algum método de reescalonamento dos dados.

Pode ser intuitivo imaginar que um modelo que maximiza a margem entre o hiperplano de separação e os pontos de treinamento mais próximos das classes, resulta em um separador mais eficiente, pois em geral quanto maior a margem menor o erro de generalização do classificador. Mas é necessário lembrar da troca entre enviesamento e variância, uma margem maior pode resultar em um aumento do enviesamento do modelo, reduzindo sua variância. Por outro lado, uma margem mais reduzida pode implicar em uma redução do enviesamento, mas um aumento da variância do modelo. Há dois métodos adotados para a escolha do tamanho da margem. O primeira, chamado de Margem Rígida (Hard Margin), é mais indicado para bases com dados linearmente separáveis, entretanto elas podem ser mais sensíveis aos outliers. O segundo método, conhecido como Margem Suave (Soft Margin), é mais indicado para datasets com dados linearmente inseparáveis e apresenta maior maleabilidade e melhor tratamento com outliers.  

Para manter um bom balanço entre o viés e a variância no método SVC, é necessário dosar dois hiperparâmetros, C e y. Os hiperparâmetros de um modelo contribuem para sua robustez e precisão, evitando que o modelo seja superdimensionado ou de eficiência insuficiente. O hiperparâmetro de regularização C controla a intensidade da regularização, mantendo com ela uma relação inversa. Quanto maior C, menor a intensidade da regularização, do tipo Ridge. O hiperparâmetro C é responsável por controlar o que se pode entender como a suavidade da margem que separa os dois clusters. Essa relação pode ser vista na figura a seguir.  

 

Para valores mais elevados de C o classificador comete menos violações de margens, o que acaba reduzindo-a. Por outro lado, valores reduzidos para C aumentam o tamanho da margem, aumentando também o número de violações de margem. Esse manejo está diretamente ligado ao controle do sobreajuste do modelo.

O hiperparâmetro y tem a função de calibrar a influência de vetores de suporte mais próximos ou mais distantes da linha separadora. Para entender melhor a importância de y é importante lembrar das funções de kernel, aplicadas em distribuições de pontos não linearmente separáveis. Essas funções realizam transformações nos pontos, tornando possível sua separação por um hiperplano. Esse processo é conhecido como um truque de kernel (kernel trick), e guarda uma relação muito próxima com o conceito de medida de similaridade. As funções de kernel podem ser mais elementares, como a polinomial de grau d, com inclinação a e uma constante de deslocamento c, muito popular em bases normalizadas.

 


As funções de kernel também podem ser mais elaboradas, como a função laplaciana, com seu parâmetro de ajuste o.


Os valores de entrada são os atributos originais e o valor de saída é uma medida da similaridade do novo espaço de atributos. Como mostrado na figura a seguir.

 


À esquerda vemos uma distribuição de pontos não linearmente separáveis, mas após a aplicação de uma função de kernel, à direita, ocorre a separação entre os pontos em relação à nova medida de similaridade compondo o espaço de atributos. O SVM entende similaridade em termos de proximidade e com isso consegue realizar a separação dos pontos, mantendo os pontos semelhantes mais próximos entre si e mais afastados dos demais.

O parâmetro y tem então um comportamento inverso ao do desvio padrão da função de kernel escolhida. Isso significa que um valor alto de y implica em uma função de kernel com baixa variância, implicando que dois pontos precisam estar relativamente próximos, para serem classificados como semelhantes. Em termos do classificador um valor alto de y fará com que apenas os pontos mais próximos da linha separadora afetaram na classificação dos pontos. Já um valor baixo de y define uma função de kernel com alta variância, o que pode classificar como similares pontos relativamente distantes entre si, o que se traduz numa influência maior dos pontos mais distantes da linha separadora, na classificação de pontos de teste. Como pode ser visto na figura a seguir.

 

Imagine agora que consideremos um dataset semelhante ao apresentado anteriormente, mas agora com a inclusão do atributo C, como pode ser visto a seguir.


 


A extrapolação do conceito bi-dimensional de linha separadora, para um conceito tri-dimensional de plano é apresentado na figura a seguir. Note que a dimensão do objeto geométrico separador das classes tem sempre uma unidade inferior àquela do espaço criado pelos atributos do dataset disponível. Isso quer dizer que em um sistema com n atributos, ou n-dimensional, o objeto separador terá (n-1) dimensões.

 

Perceba que no sistema acima um plano corta o espaço formado pelos atributos A, B e C e separa as observações entre as classes de Círculos Vermelhos, abaixo do plano e Cruzes Azuis, acima do plano. A equação geradora de um plano com dimensões, ou um hiperplano é apresentada a seguir:


Em que Wj=(W0, W1, W2,..., Wn) representa um vetor com os coeficientes associados a cada atributo, a constante W0 representa o coeficiente de interceptação do hiperplano e o vetor X=(X1, X2,..., Xn) contém os atributos de nossas observações. O SVM traça um hiperplano entre os pontos, para separá-los e realizar sua classificação, lembre-se que para pontos originalmente linearmente inseparáveis é importante a aplicação de uma função de kernel.

Uma vez que os pontos foram submetidos a uma função de kernel, que permite a criação de um hiperplano separador, o método classifica cada ponto como estando acima ou abaixo do hiperplano construído, como mostrado a seguir:

 

Pontos que recebem valor -1 são classificados como estando abaixo do plano separador, pontos com valores +1 são classificados como estando acima do plano separador.

O SVM é um dos métodos mais populares para a classificação de classes, ele tenta discriminar as classes de um dataset através da geração de um plano de separação entre os pontos. Para tanto o SVM pode mapear os dados com uma função de kernel que transforma os pontos e facilita a separação das classes. É importante tomar cuidado com o excesso de dimensões, que podem sobrecarregar o classificador forçando a aplicação de técnicas de análise de bases com alta dimensionalidade.

Aprenda sobre SVM


Na Digital House você aprende sobre o Support Vector Machines (SVM) com abordagem teórica e prática, através do nosso curso de Data Science.

Leia mais no blog DH:

Google Analytics Dashboard: crie e personalize com o nosso passo a passo

O que é brand equity e como as empresas geram valor de marca em seus produtos e serviços

Marketing digital para iniciantes: 10 dicas de como começar na carreira

E aí, já segue a gente no Twitter? Vem pra rede, vamos conversar sobre habilidades digitais! ;)


Outras notícias

Smart home: entenda o que é a inteligência artificial funcionando dentro de casa img
#Tecnologia

Smart home: entenda o que é a inteligência artificial funcionando dentro de casa

No contexto acima, não podemos negar que a transformação digital é um processo presente e constante em todos os lugares, revolucionando o dia a dia de lares e empresas. O smart home é um elemento que faz parte desse universo e ensina as pessoas a terem novos comportamentos nas tarefas de rotina em suas casas.Hoje em dia, essas questões são muito importantes, haja vista a necessidade de otimizar o tempo diante de tantas obrigações e responsabilidades que as pessoas possuem. Acompanhe este artigo e entenda tudo sobre o tema.O que é smart home?A smart home é uma tendência nos últimos anos. Esse conceito de moradia envolve o uso da tecnologia, para proporcionar mais conforto, segurança e praticidade às pessoas.Para se entender de uma forma mais clara do que seria uma smart home, imagine as seguintes situações: controlar a intensidade de luz em um determinado ambiente, programar o desligamento da iluminação em certo horário, trancar e destrancar portas sem precisar usar as chaves, acionar o enchimento da banheira e controlar a temperatura da água pelo celular, entre muitos outros exemplos.Tudo isso já é uma realidade em muitas casas e são opções de soluções disponibilizadas por empresas especializadas em automação de ambientes e algumas construtoras, que já estão entregando os seus imóveis com toda a infraestrutura e preparação necessárias para a instalação de todos os equipamentos.Vivemos um processo constante de crescimento e desenvolvimento. Pense que, no passado, por exemplo, muitos afazeres foram facilitados por criações, como geladeiras, máquinas de lavar, entre outros. A agilidade e a praticidade de uma smart home é algo que vem ganhando cada vez mais força e pretende tomar conta de cada vez mais residências.De acordo com um levantamento do IDC Brasil, a previsão é que, nos próximos anos, o mercado brasileiro de casa inteligente tenha um aumento de 30% e que o volume de negócios neste ano supere a marca de US$ 291 milhões.Se antes a presença de computadores e aparelhos sem fio já agradava e encantava muita gente, as coisas que estão surgindo são incomparáveis. Os benefícios da smart home e os equipamentos de última geração ligados à internet e integrados a sistemas sofisticados oferecem uma nova definição do que é um bom lifestyle.Exemplos aplicados do smart homeA combinação de móveis e eletrodomésticos a tecnologias faz com que o smart home consiga oferecer ainda mais conforto, acessibilidade e segurança no dia a dia das pessoas. Separamos os principais exemplos desse modelo residencial. Confira:Soluções wirelessJá parou para pensar na quantidade de equipamentos sem fio que temos disponíveis para uso? Nos projetos de smart home, as soluções wireless permitem o uso de muitos equipamentos e dispositivos ao mesmo tempo, sem precisar quebrar paredes ou ter aqueles fios aparentes pela casa.Lâmpadas inteligentesAgora é possível criar um cenário totalmente diferente nos ambientes com essas lâmpadas, que mudam de cor e intensidade somente por meio de um toque no smartphone.Sistemas de segurançaA segurança é uma questão considerada essencial e imprescindível para muitas pessoas. Nesse quesito, uma smart home pode promover a interligação entre as câmeras de monitoramento com sistemas de alarme, além do uso de sensores de presença, controle de acesso por biometria e abertura ou travamento de portas e janelas a partir do próprio celular.Assistentes virtuaisSão dispositivos ativados por comando de voz ou a partir de um simples toque no celular para auxiliar em diversas tarefas, como ligar e desligar outros aparelhos. Muitos possuem recursos de machine learning, sugerindo ações com base no comportamento da rotina dos seus usuários, como os horários que costumam chegar e sair de casa. Eletrodomésticos tecnológicosMuitos dispositivos já possuem opções de programação que podem ser feitas até remotamente pelo celular, para que realizem suas funções automaticamente. Que tal acordar e já ter o café pronto? Ou o bolo assado em um forno que desliga automaticamente por um timer de cozimento já pré-programado?Aplicações IOT (Internet of Things) em smart homeToda essa novidade oferecida pelo smart home possui um ponto muito importante: a presença do computador. Antigamente, era algo limitado ao escritório. Porém, nesse novo cenário, ele faz parte de todos os ambientes, mesmo que virtualmente.Tudo isso é uma das consequências da Internet das Coisas relacionada ao dia a dia doméstico. Com ela, é possível contar com a integração entre dispositivos e sistemas, trocando também os manuais de uso e os botões nos aparelhos por interfaces simples que instalamos em nossos dispositivos pessoais, como celular, smartwatch ou tablet.E isso é só o começo. Cada vez mais aparelhos funcionais, práticos, autossuficientes e inovadores vão surgindo no mercado, sendo capazes de aprender funções por conta própria e facilitando a vida das pessoas.A Digital House entende a importância da área de tecnologia e tem total consciência desse panorama. Cada vez mais os algoritmos de programação se tornam presentes no mercado, moldando determinadas carreiras para o mercado de trabalho do futuro.Confira as grades dos cursos de programação da DH e se torne um especialista pronto para lidar com os principais desafios do dia a dia, garantindo sua estabilidade profissional e a independência financeira almejada por tantas pessoas.Não deixe de conferir também nossa biblioteca de conteúdo e o Blog DH, com diversos outros materiais e artigos sobre as diferentes áreas do futuro, como marketing, dados, negócios digitais, programação e UX.Leia mais no blog DH:+ Google Analytics Dashboard: crie e personalize com o nosso passo a passo+ O que é brand equity e como as empresas geram valor de marca em seus produtos e serviços+ Marketing digital para iniciantes: 10 dicas de como começar na carreiraE aí, já segue a gente no Twitter? Vem pra rede, vamos conversar sobre habilidades digitais! ;)

A era do óculos inteligente img
#Tecnologia

A era do óculos inteligente

Com o avanço da tecnologia, diversos objetos do nosso dia a dia estão se tornando cada vez mais inteligentes e digitais.Há alguns dias a Ray-Ban em conjunto com o Facebook anunciaram um óculos inteligente com o objetivo de tirar fotos e gravar vídeos curtos, ouvir música e até mesmo para fazer chamadas telefônicas sem precisar ter seu celular próximo. Depois do anúncio a Xiaomi também divulgou que está desenvolvendo o seu próprio óculos inteligente que diz ser diferente dos seus concorrentes. A empresa não quer que o dispositivo seja um complemento para smartphones, mas que ele funcione de forma independente para algumas tarefas.Mas o que podemos esperar para os próximos anos com esses novos produtos?Uma época mais digitalHoje em dia, quando ligamos a televisão no noticiário ou acessamos a internet, recebemos uma chuva de novidades tecnológicas. É carro que dirige sozinho, robô que aspira a casa, inteligência artificial que acende a sua luz ou simplesmente conta uma piada para você.Percebemos que o objetivo das grandes empresas é que essas tarefas do cotidiano virem mais automatizadas e artificiais. Será que o filme Wall-E acertou em representar o mundo daquele jeito? Pode ser que sim, mas também pode ser que não!Segurança do UsuárioVoltando ao assunto dos óculos, o que mais preocupa é a segurança do usuário.Com certeza, quem já viu a famosa série Black Mirror usa algo para tampar a webcam, isso porque, através da série, descobrimos que podemos ser monitorados através das nossas câmeras, celulares e outros objetos.Agora imagine estar usando um óculos com câmera e sistema inteligente todos os dias sem se sentir observado e sem privacidade. Mesmo sendo um tema para se aprofundar e meio assustador, é algo que precisa ser pensado e colocado na mesa para uma reflexão.É incrível que o mundo esteja cada vez mais evoluindo tecnologicamente, mas devemos saber olhar o lado bom e também o lado ruim.Inteligência artificial na DH Conheça o Certified Tech Developer, um curso completo de Programação, pensado e desenhado pelo Mercado Livre e Globant em conjunto com a Digital House. Nele, você aprenderá fundamentos digitais, front-end, back-end, infraestrutura, banco de dados, além de learning agility, entre outras coisas.Para mais assuntos como esse, conheça a nossa biblioteca de conteúdo.Leia mais no blog DH:+ Google Analytics Dashboard: crie e personalize com o nosso passo a passo+ O que é brand equity e como as empresas geram valor de marca em seus produtos e serviços+ Marketing digital para iniciantes: 10 dicas de como começar na carreiraE aí, já segue a gente no Twitter? Vem pra rede, vamos conversar sobre habilidades digitais! ;)

Ciência de dados e inteligência artificial: qual é a relação entre elas? img
#Dados

Ciência de dados e inteligência artificial: qual é a relação entre elas?

Possuir a habilidade de extrair informações de valor dos dados que uma empresa coleta e saber o potencial e os possíveis usos da ciência de dados e inteligência artificial pode diferenciar uma empresa no mercado e o profissional em sua carreira.Neste artigo, você entenderá esses conceitos e a relação existente entre eles. Continue acompanhando.Qual a relação entre ciência de dados e inteligência artificial?A ciência de dados e a inteligência artificial são áreas aplicadas de forma intercambiável nas empresas. É importante saber que, embora os dados possam necessitar de alguns aspectos da IA, eles não refletem tudo. A inteligência artificial está em um processo constante de evolução e ainda há muito o que mudar e explorar.A ciência de dados é uma tecnologia que vem conquistando indústrias em todo o mundo e contribuiu para a quarta revolução industrial que ouvimos tanto falar.Isso é uma consequência da explosão maciça de informações disponíveis na internet e a crescente necessidade das organizações de se basear nos dados, para criar produtos melhores ao mercado. Isso porque é a partir deles que os negócios tomam decisões cuidadosas em suas estratégias de atuação.As várias fases e procedimentos na ciência de dados envolvem coleta, manipulação, visualização e gerenciamento de dados para prever tendências e a ocorrência de eventos futuros. Sendo assim, o profissional precisa ter um conhecimento sobre os algoritmos de aprendizado de máquina. E é aí que entra a inteligência artificial. As empresas precisam que os cientistas de dados ajudem a tomar as decisões necessárias, baseadas em dados. Eles auxiliam a entender e analisar os seus próprios desempenhos de operação e também sugerem as melhorias necessárias para impulsionar seus resultados. E também ajudam a equipe de desenvolvimento de produtos a aplicar melhorias para os clientes finais, analisando seu comportamento a partir das informações.Quanto ganha um cientista de dados e inteligência artificial?O salário de um cientista de dados inicia em R$ 4.585,00 e pode chegar até R$ 8.170,00. Sendo assim, a média salarial no Brasil é de R$ 6.144,00, dependendo das habilidades técnicas e experiências, lembrando que essas habilidades também incluem a manipulação de algoritmos de IA.Já o salário médio do profissional que decide trabalhar focado 100% na inteligência artificial, como um engenheiro de machine learning, por exemplo, segundo o site Glassdoor, é de R$ 6.772 por mês, podendo chegar a R$ 16.000,00, para nível sênior, aqui no Brasil. Os valores costumam variar conforme o porte da empresa e a experiência do trabalhador.Como é o curso de ciência de dados e inteligência artificial?Atualmente, o grande desafio dos profissionais é acompanhar as mudanças da tecnologia. Não são só os cientistas de dados e especialistas em inteligência artificial, pois essas transformações afetam todo o mercado de trabalho de uma forma geral.Os profissionais que dominam as habilidades de interpretar dados ou usá-los para promover mudanças e basear suas decisões serão sempre essenciais e ainda mais valorizados se houver o pleno domínio da inteligência artificial, para poupar tempo e o gasto de recursos.O Brasil carece de profissionais qualificados em tecnologia, formando anualmente 46 mil novas pessoas para trabalhar nas diferentes carreiras. É um número baixo de acordo com estudos que preveem a necessidade de 420 mil novos trabalhadores até 2024.Sendo assim, a recomendação é para que você não se preocupe com as mudanças do mercado de trabalho, mas invista no seu conhecimento e entendimento das novas tecnologias.O curso de Inteligência Artificial da Digital House (DH) é voltado para profissionais que já possuem experiência na área, além da familiarização com cálculos, probabilidade e estatísticas e conhecimentos básicos de machine learning.A maioria dos profissionais que optam por escolher a jornada são cientistas de dados que querem aprender novos conceitos e processos. Confira os principais:• Fundamentos da aprendizagem profunda.• Como construir redes neurais e liderar com sucesso projetos de machine learning.• Redes convolucionais, RNNs, LSTM, Adam, Dropout, BatchNorm etc.A DH é a maior referência de instituição para aprendizado de habilidades digitais da América Latina e entende a importância da inteligência artificial para o crescimento da tecnologia e o sucesso das empresas no mercado.Inscreva-se no curso e seja um especialista capaz de lidar com os desafios atuais e, consequentemente, do futuro, desenvolvendo diversas soluções inovadoras para processos organizacionais, entre outros campos.Leia mais no blog DH:+ Google Analytics Dashboard: crie e personalize com o nosso passo a passo+ O que é brand equity e como as empresas geram valor de marca em seus produtos e serviços+ Marketing digital para iniciantes: 10 dicas de como começar na carreiraE aí, já segue a gente no Twitter? Vem pra rede, vamos conversar sobre habilidades digitais! ;)