Analiza sentimenta v Excelu! Microsoft Labs ponuja brezplačen dodatek, ki vam omogoča analizo sentimenta v Excelu. Kaj če morate prebrskati stotine komentarjev ankete, da vidite, kaj si ljudje mislijo o vašem podjetju? Excel lahko dodeli verjetnost, ki prikazuje, kako pozitiven ali negativen je vsak komentar.
Oglejte si video
- Podatke ankete je enostavno količinsko opredeliti, če gre za več možnosti
- Z vrtilno tabelo lahko ugotovite, kolikšen odstotek ima posamezen odgovor
- Kaj pa odgovori na besedilo v prosti obliki? Te je težko obdelati, če jih imate na stotine ali tisoče.
- Analiza sentimenta je strojna metoda za napovedovanje pozitivnega ali negativnega odgovora.
- Microsoft ponuja orodje za analizo sentimenta v Excelu - Strojno učenje Azure.
- Tradicionalna analiza sentimenta zahteva, da človek analizira in kategorizira 5% trditev.
- Tradicionalna analiza sentimenta ni prilagodljiva - slovar boste zgradili za vsako panogo.
- Excel uporablja MPQA Subjectivity Lexicon (o tem preberite na http: // bit. Ly / 1SRNevt)
- Ta splošni slovar vključuje 5.097 negativnih in 2.533 pozitivnih besed
- Vsaki besedi je dodeljena močna ali šibka polarnost
- To se odlično obnese za kratke stavke, kot so tviti ali objave na Facebooku
- Dvojni negativi ga lahko zavedejo
- Za namestitev pojdite na Vstavi, Trgovina Excel, poiščite Azure Machine Learning
- Navedite obseg vnosa in dva prazna stolpca za izhodno območje.
- Naslov vhodnega obsega se mora ujemati s shemo: tweet_text
- Spremljevalni članek na: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/
Video zapis
Naučite se Excel iz Podcasta, Epizoda 2062: Analiza sentimenta v Excelu
O, hej, bila je noč zahvalnega dne in sedeli smo okrog bučne pite in Jes, naš prijatelj, je začel govoriti o analizi sentimenta na podatkih Twitterja. In rekel sem: "Hej, saj veste, da ima Excel način za analizo sentimenta." In spoznal sem, da nimam dobrega videoposnetka o tem ali katerem koli videoposnetku o tem, zato gre za analizo sentimenta v Excelu.
Zdaj je prvo vprašanje, kaj za vraga je analiza sentimenta? In če opravite anketo med strankami in imajo več možnosti izbire, kjer lahko izbirajo med 1 in 5, je to res zelo enostavno analizirati. Lahko samo ustvarite majhno vrtilno tabelo: Vstavite vrtilno tabelo, Obstoječi delovni list tukaj, kliknite V redu. Želimo vedeti tamkajšnje vprašanje ali odgovor na vprašanje, nato pa, koliko odgovorov je bilo za vsakega, in to nam daje absolutno število. Lahko celo vstopite sem in to spremenite iz Nastavitve polja v Pokaži vrednosti kot% skupnega števila stolpcev.
V redu, tako da lahko vidite za vsak odgovor, koliko odstotkov ljudi dobi odgovor. V redu, toda analiza sentimenta je namenjena takrat, ko imaš res dolg odgovor, ko rečeš: "Hej, v redu, saj veste, povejte nam, zakaj ste nam dali tak odgovor?" In oni, veste, uporabljajo stavke ali odstavke. No, če jih imate na stotine ali tisoče, jih nekdo zelo težko prebere in prebere vse ter ugotovi, kaj se dogaja, prav?
Torej obstajata dve različni analizi sentimenta. V preteklosti bi običajno uporabljali človeški algoritem pod nadzorom. Torej, če ste imeli 5000 odgovorov, poglejte, veste, 200 izmed njih in izberite pozitivne in negativne besede in besedne zveze. V bistvu sestavljate slovar pozitivnih in negativnih besed; ampak, veste, to je bilo zelo omejujoče. Če ste to storili pri kraju, ki je opravljal popravila avtomobilov in je imel potem drugačno stranko, veste, kdo je opravil čiščenje preprog, sta ta dva slovarja popolnoma različna. Vedno znova in znova morate opraviti strojno učenje ali učenje pod nadzorom ljudi. Torej, Excel uporablja to stvar, imenovano MPQA Subjectivity Lexicon, in lahko to poiščete v Googlu. Vsebuje informacije o tem - 5.097 negativnih besed, 2533 pozitivnih besed. In tako,odlično se obnese za kratke stavke ali tvite ali objave na Facebooku. Toda nekaj, kar sem opazil, je, da če nekdo piše v dvojnih negativih, ne morem reči, da te funkcije ne sovražim, no, tam bo strojno učenje propadlo. In hudiča, ne uspem. Ne vem, ali so srečni ali ne.
V redu, torej, kaj počnemo. V Excelu 2013 ali Excelu 2016 pojdite na zavihek Vstavi, pojdite v Trgovina, ko se v iskalnem polju odpre iskanje Azure Machine in tam dobite Azure Machine Learning. Kliknemo Dodaj. V redu in tukaj sta dve različni orodji: Titanic Survivor Predictor, ki je zabavno; in dodatek Excel za analizo sentimenta besedila. Uporabimo tisto. V redu, tukaj je nekaj stvari, ki vas bodo spotaknile. Vaš naslov: Vzemite odstavek, da pojasnite svoj odgovor. Ujemati se mora s shemo in shema pravi, da mora naslov napisati tweet_text. Torej, tu zgoraj: tweet_text, seveda, pomembne za velike in male črke, v redu. Nato zaprite shemo in nato Predvidevanje, vnos: od A1 do 100, moji podatki imajo glave, izhod: DataB1, vključite glave. Dali nam bodo 2 stolpca.Prepričajte se, da imate tam 2 prazna stolpca; v nasprotnem primeru bo preglasil podatke. Na voljo imate dve možnosti: nekaj vrstic naenkrat ali kot paket. To je le sto, zato je resnično vseeno. Izbral bom Predvid in BAM! Tako hitro.
Zdaj imamo dva stolpca: dobimo Sentiment in Score, v redu. Torej, predstavimo rezultate tukaj kot odstotke s kopico decimalnih mest. Torej, 47.496, to pomeni od 0 do 100%. Blizu 100 je izjemno pozitivno, blizu 0 je skrajno negativno, v redu? Torej, imamo enega, pri katerem je manjša težava, kar me spravlja ob pamet. Ne najdem rešitve, zato lahko vidite, zakaj je to ocenjeno kot izjemno negativno. Poglejmo tisto, ki je zelo pozitivna. V redu, torej veste, zato imamo tukaj nekaj veselih besed: prosim in hvala, klicaji in tako naprej. To bi lahko prispevalo k visokim rezultatom. V redu, ali je popoln? Ne, vendar vam bomo na hiter in hiter način povedali, veste, koliko ljudi je teh odgovorov zelo veselo ali izredno negativno.
In seveda, spet tukaj lahko to storimo z vrtilno tabelo: Vstavi, vrtilna tabela, pojdite na obstoječi delovni list tukaj, kliknite V redu in zanima nas Sentiment, potem pa je morda s povprečno oceno za vsak od teh. Torej bomo v razdelku Nastavitve polja to spremenili v Povprečje, kliknite V redu. In tako ali morda celo grof. Mislim, da bi želeli vedeti grofa, koliko ljudi. Torej bomo vzeli neko drugo področje in tako bomo vedeli, koliko ljudi je bilo negativnih. Ooh, koliko ljudi je bilo nevtralnih, koliko ljudi je bilo pozitivnih in kakšen je bil povprečni rezultat vsakega od njih.
Torej, če imate podatke o anketi in imate več možnosti, lahko z vrtilno tabelo enostavno ugotovite, kolikšen odstotek ima vsak odgovor. Toda za besedilne odgovore v prosti obliki je težko obdelati. Če jih imate na stotine ali tisoče, je analiza sentimenta strojna metoda za napovedovanje, ali je odgovor pozitiven ali negativen. Microsoft za to ponuja brezplačno orodje. Deluje v Excelu 2013 ali Excelu 2016, imenovanem Strojno učenje Azure. Običajno je treba ročno pregledati in kategorizirati 5% izjav. Ni prilagodljiv, za vsak nov nabor podatkov ga je treba ponovno kategorizirati, vendar Excel uporablja ta leksikon MPQA Subjectivity. To je splošni slovar. Delovalo bo za kratke stavke, tvite in objave na Facebooku. Dvojni negativi me lahko zavedejo. Pojdite v trgovino Excel,poiščite Azure Machine Learning. Navedite vhod in dva stolpca za izhodno območje. Ne pozabite spremeniti naslova, da se v tem primeru ujema s shemo, tweet_text.
V redu, torej. Naslednjič, ko boste imeli veliko podatkov za analizo, preverite z uporabo Azure Machine Learning, brezplačnega dodatka za Excel 2013. Hvala, ker ste se ustavili, prihodnjič se vidimo za drugo oddajo od.
Prenesite datoteko
Prenesite vzorčno datoteko tukaj: Podcast2062.xlsm