Naturaj Lingvoj

Chris Manning kaj Dan Jurafsky

Klaso komencas februaro 2012

Pri La Kurso

Ni proponas tiun kurson pri Naturaj Lingvoj senpagaj kaj online por studentoj en ĉiuj, ekde februaro 2012, daŭrigante Stanford la ekscita incursiones en granda skalo en linio instrukcio. Studentoj havos aliron al screencast prelego videos, estas donitaj kvizo demandojn, taskoj kaj ekzamenoj, ricevos regulajn reagojn pri progreso, kaj povas partopreni en diskuto forumo. Kiuj sukcese kompletigi la kurson ricevos deklaro de realigo. Instruas Instruistoj Jurafsky kaj Manning, la curriculum altiras de Stanford la kursoj en Naturaj Lingvoj. Vi bezonos deca interretan konekton por konsenti kursmaterialojn, sed devus kapabli observi la videos en via smartphone.

Kial Studu Naturaj Lingvoj?

Natura lingvo prilaborado estas la teknologio por kontraktanta kun niaj plej ĉieesta produkto: homa lingvo, kiel ĝi aperas en emails, retpaĝoj, tweets, produkto priskriboj, ĵurnalo historioj, sociaj amaskomunikiloj, kaj sciencaj artikoloj, en miloj da lingvoj kaj varioj. En la pasinta jardeko, sukcesa natura lingvo prilaborado aplikoj iĝis parto de nia ĉiutaga sperto, de literumado kaj gramatiko korekto en verkilo por maŝina tradukado en la reto, el email spamado detekto al aŭtomata demando responde de detekti popola opinioj pri produktoj aŭ servoj por ĉerpi nomumoj de via retpoŝto. En ĉi tiu klaso, vi lernos la fundamentajn algoritmoj kaj matematikaj modeloj por homa lingvo prilaborado kaj kiel vi povas uzi ilin por solvi praktikan problemojn en kontraktanta kun lingvo datumoj kien vi renkontos ĝin.

Kio Fona Ĉu mi bezonas?

Neniu fono en natura lingvo prilaborado estas bezonata. Studentoj estos atendas scii iom de bazaj probablo (scias Bayes regulo), iom pri vektoroj kaj vektoraj spacoj (povus longo normaligi vektoro), iom de kalkulo (scias ke la derivaĵo de funkcio estas nulo je maksimumo aŭ minimumo de funkcio), sed ni revizios tiuj konceptoj kiel ni unue uzas ilin. Vi devus havi racian programado kapablo (scii pri hash tabloj kaj grafeo datumstrukturoj), povi skribi programojn en Java aŭ Python, kaj havas komputilon (Windows, Mac aŭ Linux) kun retaliro.

Kio Lernolibro Ĉu mi Buy?

Ni provizos detalan prelegon notoj de ĉiuj teknikaj enhavo, kiu estos via subteni post la fino de klaso. Multaj lernantoj fari delikatan ĝuste laborante de la prelegoj kaj notoj. Sed aliaj trovas ĝin tre utila havi akompanan lernolibro, por plifortigi la kerno materialo, kiel fonto de pliaj ekzercoj, kaj kiel referenco por la estonteco.

La plej bona lernolibro por la klaso estas Jurafsky kaj Martin, Parolado kaj Lingvo Processing 2nd Edition , kompletigita de ĉapitroj de Manning, Schütze kaj Raghavan 2008 ; aliaj utilaj, bonaj libroj inkludas Manning kaj Schütze 1999 , kaj Bird, Klein kaj Loper 2009 .

Kurso Priskribo

La kurso kovras larĝan gamon de temoj en natura lingvo prilaborado, inkludante vorto kaj frazo tokenization, teksto klasifiko kaj sento analizo, ortografio korekto, informoj eltiro, analizo, signifas eltiro, kaj demando responde Ni ankaŭ enkonduki la suba teorio de probablo, statistiko, kaj maŝina lerno kiuj estas gravega por la kampo, kaj kovru fundamentaj algoritmoj kiel n-gramo lingvo modelado, naiva Bayes kaj maxent classifiers, vico modeloj kiel Kaŝita Markova Modeloj, probableca dependeco kaj konsistigaj sintaksa analizo, kaj vektoro-spaco modeloj de signifo.

Preparado

Por prepari por la klaso de anticipo, vi povas konsideri tralegado iuj sekcioj de la lernolibroj ( Jurafsky kaj Martin, Parolado kaj Lingvo Processing 2nd Edition , kaj Manning, Schütze kaj Raghavan 2008 ).

La jenaj temoj estos kovritaj de la du unuaj semajnoj:

  1. Enkonduko kaj Priskribo:
  2. Baza Teksto Processing: J + M Ĉapitroj 2.1, 3.9; MR + S Ĉapitroj 2.1-2.2
  3. Minimuma Edit Distanco: J + M Ĉapitro 3.11
  4. Lingvo Modelado: J + M Ĉapitro 4
  5. Literumas Korekto: J + M Ĉapitroj 5.9, Peter Norvig (2007) Kiel Skribi Spelling Corrector

La Instruistoj

Instruistoj Jurafsky kaj Manning estas la ĉefaj naturaj lingvo prilaborado edukistoj, per siaj lernolibroj pri natura lingvo prilaborado, parolado, kaj inform-akiro.

Dan Jurafsky estas Profesoro de Lingvistiko kaj profesoro de Ĝentileco de Komputila Scienco ĉe Stanford University. Dan ricevis lian fraŭloj grado en lingvistiko en 1983 kaj lia Ph.D. en Komputila Scienco en 1992, ambaŭ de la Universitato de Kalifornio ĉe Berkeley, kaj ankaŭ instruis en la Universitato de Colorado, Boulder antaŭ kunigi la Stanford fakultato en 2004. Li estas la ricevanto de MacArthur Fellowship kaj ĝi utilis en vario de eldonejo tabulojn, kompania konsulta tabulojn kaj programo komitatoj. Donas la esploro etendas vaste tra natura lingvo prilaborado tiel kiel ĝia apliko al la konduto kaj sociaj sciencoj.

Christopher Manning estas vicprofesoro de Komputila Scienco kaj lingvistiko ĉe Universitato Stanford. Chris ricevis fraŭloj grado kaj Universitato Medalo de la Aŭstralia Nacia Universitato kaj Ph.D. de Stanford en 1994, ambaŭ en Lingvistiko. Chris instruis en la Carnegie Mellon University kaj la Universitato de Sidnejo antaŭ kunigi la Stanford fakultato en 1999. Li estas membro de la Amerika Asocio por Artefarita Inteligenteco, kaj estas unu el la plej cititaj aŭtoroj en natura lingvo prilaborado, por lia esploro sur larĝan gamon de statistika natura lingvo temojn el tagging kaj sintaksa analizo por gramatiko indukto kaj teksto kompreno.

Oftaj Demandoj

  1. Kiam tio la klaso komenci? La klaso komencos februaro 2012, kaj daŭros proksimume 8 semajnoj.
  2. Kio estas la formato de la klaso? La klaso konsistos el prelego videos, kiu estas rompita en malgrandajn pecojn, kutime inter 8 kaj 12 minutoj ĉiu. Iuj el tiuj povas enhavi integritaj kvizo demandoj. Ankaŭ estos standalone kvizojn kiuj ne estas parto de video konferencoj, kaj programado taskojn.
  3. Ĉu la teksto de la prelegoj estos disponebla? Ni esperas por transskribi la prelegoj en teksto por fari ilin pli atingeblaj por tiuj ne flue parolas angla. Sekvu.
  4. Ĉu mi devas rigardi la prelegoj vivas? Ne Vi povas spekti la prelegoj je via libertempo.
  5. Ĉu online studentoj demandojn kaj / aŭ kontaktu la instruistoj? Jes, sed ne rekte. Estas Q & A forumo en kiu studentoj rangi demandoj kaj respondoj, tiel ke la plej gravaj demandoj kaj plej bonaj respondoj veziko ĝis la supro. Instruado personaro estos kontroli tiuj forumoj, tiel ke gravaj demandoj ne respondis per aliaj studentoj povas trakti.
  6. Ĉu aliaj Stanford rimedoj haveblos al perretaj lernantoj? Ne
  7. Kiom laboro mi atendus vidi en ĉi tiu klaso?
    • Pri 2 horoj de video segmentoj ĉiu semajno, enhavante inline ungraded kvizo demandoj
    • Aligxoj gradita multnombra elekto aŭ mallonga respondo ekzercoj.
    • A substanca semajna hejmtasko (kutime programado projekto).
  8. Kiom ĝi kostas preni la kurso? Nenio: ĝi estas libera!
  9. Ĉu mi povas universitatan krediton por preni ĉi tiu kurso? Ne