Analýza sentimentu v programe Excel! K dispozícii je bezplatný doplnok od Microsoft Labs, ktorý vám umožní vykonávať analýzu sentimentu v Exceli. Čo ak sa musíte brodiť stovkami komentárov k prieskumu, aby ste zistili, čo si ľudia myslia o vašej spoločnosti? Excel môže priradiť pravdepodobnosť ukazujúcu, aký pozitívny alebo negatívny je každý komentár.
Pozeraj video
- Dáta z prieskumu je ľahké kvantifikovať, ak majú výber z viacerých možností
- Pomocou kontingenčnej tabuľky môžete zistiť, koľko percent má každá odpoveď
- Čo však s textovými odpoveďami vo voľnom formáte? Tieto sú ťažko spracovateľné, ak ich máte stovky alebo tisíce.
- Analýza sentimentu je strojová metóda na predpovedanie pozitívnej alebo negatívnej odpovede.
- Spoločnosť Microsoft ponúka nástroj na vykonávanie analýzy sentimentu v programe Excel - Azure Machine Learning.
- Tradičná analýza sentimentu vyžaduje, aby človek analyzoval a kategorizoval 5% výrokov.
- Tradičná analýza sentimentu nie je flexibilná - znova vytvoríte slovník pre každé odvetvie.
- Excel používa MPQA Subjectivity Lexicon (o tom si prečítajte na http: // bit. Ly / 1SRNevt)
- Tento všeobecný slovník obsahuje 5 097 negatívnych a 2 533 pozitívnych slov
- Každému slovu je priradená silná alebo slabá polarita
- To funguje skvele pri krátkych vetách, ako sú tweety alebo príspevky na Facebooku
- Môže sa nechať oklamať dvojitým negatívom
- Ak chcete nainštalovať, prejdite do Vložiť, Excel Store, vyhľadajte Azure Machine Learning
- Zadajte vstupný rozsah a dva prázdne stĺpce pre výstupný rozsah.
- Nadpis vstupného rozsahu sa musí zhodovať so schémou: tweet_text
- Sprievodný článok na adrese: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/
Prepis videa
Naučte sa Excel z Podcastu, epizóda 2062: Analýza sentimentu v Exceli
Och, hej, bola noc vďakyvzdania a sedeli sme okolo tekvicového koláča a Jes, náš priateľ, začal hovoriť o analýze sentimentu na dátach z Twitteru. A ja som odpovedal: „Hej, vieš, že Excel má spôsob, ako robiť sentimentálnu analýzu.“ A uvedomil som si, že k tomu nemám dobré video ani k tomu žiadne video, takže toto video je o analýze sentimentu v programe Excel.
Prvá otázka je, čo je sakra analýza sentimentu? A ak urobíte prieskum medzi svojimi zákazníkmi a tí majú výber z viacerých možností, kde si môžu vybrať od 1 do 5, je to skutočne, naozaj ľahké, analyzovať. Môžete len vytvoriť malú kontingenčnú tabuľku: Vložiť kontingenčnú tabuľku, Existujúci pracovný hárok tu, kliknite na OK. Chceme vedieť otázku alebo odpoveď na otázku a potom to, koľko odpovedí bolo na každú z nich, a to nám dá absolútne číslo. Môžete sem dokonca vojsť a zmeniť to z nastavenia poľa na podobné hodnoty, ktoré sa zobrazia ako% z celkového počtu stĺpcov.
Dobre, takže pri každej odpovedi vidíte, aké percento ľudí dostane odpoveď. Dobre, ale analýza sentimentu je taká, keď máte naozaj dlhú odpoveď, kde poviete: „Hej, dobre, dobre, vieš, povedz nám, prečo si nám dal túto odpoveď?“ A oni, viete, používajú vety alebo odseky. No, ak ich máte stovky alebo tisíce, je pre niekoho veľmi ťažké prejsť nimi, prečítať si ich všetky a zistiť, o čo ide, dobre?
Existujú teda dva rôzne druhy analýzy sentimentu. Spravidla v minulosti ste používali výučbový algoritmus pod dohľadom človeka. Takže ak ste mali 5 000 odpovedí, prejdite cez 200 z nich a vyberte si pozitívne a negatívne slová a frázy. V podstate budujete slovník pozitívnych a negatívnych slov; ale viete, toto bolo veľmi obmedzujúce. Ak ste to urobili pre miesto, ktoré opravovalo autá, a potom ste mali iného zákazníka, viete, kto čistil koberce, sú tieto dva slovníky úplne odlišné. Musíte sa učiť strojové učenie alebo učenie pod dohľadom človeka znova a znova a znova. Excel teda používa túto vec zvanú MPQA Subjectivity Lexicon a vy môžete ísť do vyhľadávača Google. Má o sebe informácie - 5 097 negatívnych slov, 2533 pozitívnych slov. A tak,funguje to skvele na krátke vety alebo tweety alebo príspevky na Facebooku. Ale jednu vec som si všimol, že ak niekto píše dvojitým záporom, nemôžem povedať, že túto funkciu neznášam, teda, strojové učenie tam zlyhá. A sakra, zlyhávam. Neviem zistiť, či sú šťastní alebo nie.
Dobre, takže tu je to, čo robíme. V programe Excel 2013 alebo Excel 2016 prejdite na kartu Vložiť, potom do obchodu, keď sa zobrazí vyhľadávacie pole, vyhľadajte Azure Machine a získate Azure Machine Learning priamo tam. Klikneme na Pridať. Dobre, a dva rôzne nástroje: Titanic Survivor Predictor, čo je zábava; a doplnok Excel pre analýzu textového sentimentu. Využime ten. Dobre, tu je niekoľko vecí, ktoré ťa potknú. Váš nadpis: Odveďte odsek, v ktorom vysvetlíte svoju odpoveď. Musí zodpovedať schéme a schéma hovorí, že nadpis musí obsahovať tweet_text. Takže tu hore: tweet_text, samozrejme, záleží na veciach veľkých a malých písmen, dobre. A potom zavrite schému a potom Predpovedať, Vstup: A1 až 100, Moje údaje majú hlavičky, Výstup: DataB1, Zahrnúť hlavičky. Dajú nám 2 stĺpce.Uistite sa, že tam máte 2 prázdne stĺpce; v opačnom prípade to prepíše údaje. Máte 2 možnosti: Niekoľko riadkov naraz alebo Ako dávka. Je to iba stovka, takže na tom skutočne nezáleží. Vyberiem Predict a BAM! Len tak rýchlo.
V poriadku, teraz máme 2 stĺpce: dostaneme sentiment a skóre, v poriadku. Predstavujme tu teda skóre ako percentá s hromadou desatinných miest. Dobre, takže 47 496, to ide z 0 na 100%. Blízko 100 je mimoriadne pozitívne, blízko 0 veľmi negatívne, dobre? Takže tu máme jeden, v ktorom je menší problém, ma privádza do šialenstva. Nemôžete nájsť riešenie, takže vidíte, prečo je to hodnotené ako mimoriadne negatívne. Pozrime sa na ten, ktorý príde mimoriadne pozitívne. Dobre, takže viete, takže tu máme niekoľko šťastných slov: prosím a ďakujem vám, výkričníky a tak ďalej. To by mohlo prispievať k vysokému skóre. Dobre, je to perfektné? Nie, ale dá vám rýchly a rýchly spôsob, ako vám povedať, koľko ľudí je z týchto odpovedí mimoriadne šťastných alebo mimoriadne negatívnych.
A samozrejme, opäť to môžeme urobiť pomocou kontingenčnej tabuľky: Vložiť, Kontingenčná tabuľka, prejsť na existujúci pracovný hárok tu, kliknúť na OK a zaujíma nás sentiment, a potom možno s priemerným skóre pre každý z nich. Takže to zmeníme v časti Nastavenia poľa na Priemer, kliknite na OK. A tak, alebo možno aj gróf. Asi by sme chceli vedieť grófa, koľko ľudí. Zoberieme si teda nejaký iný odbor, a teda vieme, koľko ľudí bolo negatívnych. Ó, koľko ľudí bolo neutrálnych, koľko ľudí bolo pozitívnych a aké bolo priemerné skóre každého z nich.
Dobre, takže ak máte údaje z prieskumu a je ich výber z viacerých možností, pomocou kontingenčnej tabuľky ľahko zistíte, koľko percent má každá odpoveď. Ale pre textové odpovede vo voľnom formáte je ťažké ich spracovať. Ak ich máte stovky alebo tisíce, analýza sentimentu je strojová metóda na predpovedanie pozitívnej alebo negatívnej odpovede. Spoločnosť Microsoft k tomu ponúka bezplatný nástroj. Funguje v programe Excel 2013 alebo Excel 2016 s názvom Azure Machine Learning. Zvyčajne musíte prejsť a kategorizovať 5% výpisov ručne. Nie je to flexibilné, musíte kategorizovať každú novú množinu údajov, ale Excel používa tento lexikón subjektivity MPQA. Je to všeobecný slovník. Bude to fungovať na krátke vety, tweety, príspevky na Facebooku. Môžem sa nechať oklamať dvojitým negatívom. Takže choďte do obchodu Excel,vyhľadajte Azure Machine Learning. Zadajte vstup a dva stĺpce pre výstupný rozsah. Nezabudnite v tomto konkrétnom prípade zmeniť nadpis tak, aby zodpovedal schéme tweet_text.
Dobre, takže ideme. Až nabudúce budete mať k dispozícii veľké množstvo údajov na analýzu, vyskúšajte to pomocou Azure Machine Learning, bezplatného doplnku pre Excel 2013. Ďakujeme, že ste sa zastavili, a uvidíme sa nabudúce pri ďalšom netcaste z.
Stiahnuť súbor
Stiahnutie vzorového súboru nájdete tu: Podcast2062.xlsm