Stödvektormaskin

En stödvektormaskin (eng. support-vector machine) är en typ av statistisk klassificerare, närmare bestämt en generaliserad linjär klassificerare. Den linjära formuleringen av algoritmen introducerades av Vladimir Vapnik 1963.

Metoden kan även användas för regression.

Stödvektormaskiner betraktas som robusta och har använts i många praktiska tillämpningar, till exempel för optisk teckenigenkänning samt ett stort antal olika områden inom språkteknologin och även objektigenkänning i datorseende. De kan hantera relativt stora träningsmängder och har metoder för att förhindra överanpassning.

Träning av stödvektormaskin

Antag att vi har en mängd exempel $\left\{(y_{i},x_{i})\right\}$ , där varje $y_{i}$ är ett klassvärde som är +1 eller -1, och varje $x_{i}$ är en attributvektor.

En stödvektormaskin med linjär kärna får vi då genom att finna det hyperplan (i det tvådimensionella fallet den linje) som maximalt separerar de två klasserna +1 och -1. Klassificeraren beskrivs då med hjälp av skalärprodukter med exempelvektorn och har den vanliga formen för en linjär klassificerare:

$f(x)=\mathbf {sign} \sum \alpha _{i}\left\langle x_{i},x\right\rangle +b$

Ofta används inte den vanliga skalärprodukten (linjär kärna $K(x_{i},x)=\left\langle x_{i},x\right\rangle$ ) utan en skalärprodukt i ett högre rum (olinjär kärna $K(x_{i},x)=\left\langle \phi (x_{i}),\phi (x)\right\rangle$ ). Då finns inte hyperplanet i attributrummet självt utan i ett rum av högre dimension (se generaliserad linjär klassificerare).

Eftersom träningsdata ofta innehåller felaktigt klassificerade exempel ("brus") brukar man sätta en gräns $C$ för hur stora konstanterna $\alpha _{i}$ får bli, för att undvika överanpassning av klassificeraren.

För att finna hyperplanet löses ett kvadratiskt optimeringsproblem. Den vanligaste metoden att lösa optimeringsproblemet kallas SMO (sequential minimal optimisation) och är relativt enkel att implementera och snabb att lösa problemet.

Externa länkar

Scholia har publikationer om Stödvektormaskin

Navigation

Navigering

Temaportaler

Stödvektormaskin

Träning av stödvektormaskin

Externa länkar

Media som används på denna webbplats