Máltækni
Máltækni
MA gráða – 120 einingar
Máltækni miðar að því að þróa búnað sem getur unnið með og skilið náttúruleg tungumál og stuðla að notkun þeirra í samskiptum manns og tölvu.
Máltækni er þverfaglegt rannsóknar- og þróunarsvið sem spannar m.a. tölvunarfræði, málvísindi, gervigreind, tölfræði og sálfræði
Skipulag náms
- Haust
- Íslenskt málkerfi og máltækniB
- Forritun í máltækniB
- Tölvunarfræði 1aB
- Að meta og bæta málmyndandi líkön: Nálgun málfræðingsV
- GervigreindV
- Inngangur að djúpum tauganetumV
- RannsóknarverkefniV
- Vor
- Gagnaöflun og tölfræðiúrvinnsla í hugvísindum og máltækni VE
- Lífsferill gervigreindarlausnaV
- Áhrifavaldalíkön af máli í ljósi flókinna kerfaV
- RannsóknarverkefniV
Íslenskt málkerfi og máltækni (MLT301F)
Námskeiðið er ætlað máltækninemum sem ekki hafa málfræðibakgrunn. Tilgangur þess er að gefa yfirlit um helstu einkenni íslensks málkerfis, einkum þau sem huga þarf sérstaklega að við vélræna greiningu. Helstu viðfangsefnin verða íslenskt hljóðkerfi og hljóðritun (IPA og SAMPA); íslenskt beygingarkerfi og orðmyndun með sérstakri áherslu á málfræðilega mörkun og markamengi; og íslensk setningagerð með áherslu á þáttun, bæði liðgerðarvensl (phrase structure) og hæðisvensl (dependency).
Forritun í máltækni (MLT701F)
Námskeiðið er fyrst og fremst ætlað meistaranemum í máltækni sem taka námið við Íslensku- og menningardeild HÍ, hafa bakgrunn í málvísindum en lítinn sem engan í tölvunarfræði. Þetta námskeið taka þeir í flestum tilvikum samhliða námskeiðinu Tölvunarfræði 1a. Hafi einhver með annars konar bakgrunn áhuga á námskeiðinu er þó sjálfsagt að hafa samband við kennara fyrir frekari upplýsingar.
Tilgangur þessa námskeiðs er að styðja við nemendur á fyrstu stigum forritunar, aðstoða þá við að ná tökum á grunnþáttum hennar og veita þeim þjálfun í að leysa einföld en fjölbreytt máltækniverkefni í forritunarmálinu Python. Að auki kynnast nemendur málvinnslutólinu NLTK (Natural Language Toolkit) sem þeir munu jafnframt nota frekar í námskeiðum um málvinnslu.
Tölvunarfræði 1a (TÖL105G)
Einingar til BS-prófs gilda aðeins fyrir annaðhvort TÖL101G Tölvunarfræði 1 eða TÖL105G Tölvunarfræði 1a.
Forritun í Python (sniðið að verkfræðilegum og raunvísindalegum útreikningum): Helstu skipanir og setningar (útreikningur, stýri-setningar, innlestur og útskrift), skilgreining og inning falla, gagnatög (tölur, fylki, strengir, rökgildi, færslur), aðgerðir og innbyggð föll, vigur- og fylkjareikningur, skráavinnsla, tölfræðileg úrvinnsla, myndvinnsla. Hlutbundin forritun: klasar, hlutir, smiðir og aðferðir. Hugtök tengd hönnun og smíði tölvukerfa: Forritunarumhverfi, vinnubrögð við forritun, gerð falla- og undirforritasafna og tilheyrandi skjölun, villuleit og prófun forrita.
Að meta og bæta málmyndandi líkön: Nálgun málfræðings (MLT703F)
Hefur þú einhvern tímann velt fyrir þér hvernig málvísindamenn geta bætt risamállíkön (e. Large Language Models; LLMs)? Í þessu námskeiði munu nemendur kynnast því mikilvæga hlutverki sem málvísindamenn og sérfræðingar í tungumálum gegna þegar kemur að því að bæta textagerð gervigreindar. Námskeiðinu er ætlað að veita nemendum ítarlegan skilning og færni til að meta og bæta útkomu textagerðarlíkana sem notuð eru í mállíkönum með því að kafa ofan í margbreytileika tungumálsins eins og það er túlkað og framleitt með gervigreind. Sérstök áhersla verður lögð á málfræðilega þætti eins og setningafræði, merkingarfræði, málfræði og orðræðugreiningu.
Viðfangsefni: Grundvallaratriði í risamállíkönum: Uppbygging og textamyndunarferli risamállíkana Matsaðferðir: Fyrirliggjandi mælikvarðar og aðferðafræði til að meta gæði, samfellu og samhengislegt mikilvægi texta sem unninn er með gervigreind. Gagnasöfn fyrir markvissa fínstillingu: Að greina ákjósanleg gagnasöfn fyrir fínstillingu á risamállíkönum eftir sérstökum notkunartilvikum.
Gervigreind (REI505M)
Fjallað er um hugtök, aðferðir og reiknirit á sviði gervigreindar, með áherslu á studdan og óstuddan lærdóm. Forvinnsla og myndræn framsetning gagna. Mat á gæðum líkana og val á líkönum. Línuleg aðhvarfsgreining, næstu nágrannar, stoðvigravélar, tauganet, ákvarðanatré og safnaðferðir. Djúpur lærdómur. Þyrpingagreining og k-means aðferðin. Nemendur útfæra einföld reiknirit í Python og læra á sérhæfða forritspakka. Námskeiðinu lýkur með hagnýtu verkefni.
Inngangur að djúpum tauganetum (TÖL506M)
Í þessu námskeiði förum við yfir djúp tauganet og helstu aðferðir tengdar þeim. Kynnt verða net og aðferðir fyrir mynd, hljóð og textagreiningu. Lögð verður áhersla á hagnýtingu lausna og munu nemendur t.a.m. kynna verkefni eða grein á þessu sviði.
Rannsóknarverkefni (MLT001F)
Rannsóknarverkefni í máltækni. Nemandi vinnur sjálfstætt rannsóknarverkefni í samvinnu við leiðbeinanda. Mikilvægt er að hafa samband við greinarformann hafi nemandi áhuga á að taka rannsóknarverkefni.
Gagnaöflun og tölfræðiúrvinnsla í hugvísindum og máltækni (ÍSL612M)
Á undanförnum árum hefur vægi gagnasöfnunar og tölfræðiúrvinnslu aukist í hugvísindum. Þetta kemur skýrt fram í undirgreinum á borð við sálfræðileg málvísindi (e. psycholinguistics), hugræna bókmenntafræði (e. cognitive literary studies) og tilraunaheimspeki (e. experimental philosophy). Þessi aukna áhersla á megindlega aðferðafræði í hugvísindum á sér stað á sama tíma og réttmæti rótgróinna tölfræðiaðferða er dregið í efa í öðrum greinum og hertar kröfur eru um að hægt sé að endurtaka rannsóknir og nálgast gögn í opnum aðgangi um leið og persónuverndar er gætt. Í þessu námskeiði munu nemendur rýna í vægi megindlegra aðferða í sínum greinum og fá þjálfun í öflun og úrvinnslu gagna. Fjölbreyttar rannsóknaraðferðir verða til umfjöllunar, allt frá greiningu textasafna yfir í skoðanakannanir og tilraunir þar sem skynjun áreita (svo sem orða, texta eða myndbrota) er mæld. Einnig verður farið yfir grunnhugtök og aðferðir í tölfræði svo nemendur þekki muninn á lýsandi tölfræði og ályktunartölfræði, skilji tölfræðilega marktækni og kunni að lesa úr myndrænni framsetningu gagna í gröfum. Lögð er áhersla á að nemendur spreyti sig undir leiðsögn kennara og bæði safni gögnum og greini þau. Nemendur vinna verkefni innan eigin fræðigreinar en kanna einnig grundvöll fyrir þverfaglegu samstarfi. Öll verkefni verða unnin í opnum hugbúnaði á borð við R Studio en engin fyrri þekking á forritinu né tölfræði er nauðsynleg. Námskeiðið hentar öllum nemendum á Hugvísindasviði sem vilja safna megindlegum gögnum til að svara áhugaverðum spurningum og gæti þannig reynst vel sem undirbúningur fyrir BA- eða MA-verkefni.
Lífsferill gervigreindarlausna (REI603M)
Í þessu námskeiði kynnumst við lífsferli gervigreindarlausna og hvernig þróa á rekstrarhæfar lausnir.
Við förum yfir eftirfarandi skref lífsferilsins:
- Gagnasöfnun og undirbúningur gagna
- Breytuval
- Þjálfun líkana
- Mat á gæðum líkana
- Líkön sett í rekstur
- Líkön sem þjónustur
- Hvernig vakta á líkön
- Hvernig viðhalda á líkönum
Yfir misserið verða þrjú stór verkefni þar sem nemendur keppa um að smíða gervigreindarlausnir.
Áhrifavaldalíkön af máli í ljósi flókinna kerfa (MLT806F)
Í þessu MA-námskeiði er kafað ofan í áhugaverða samþættingu gagnamálfræði (e. Computational Linguistics) og flókinna kerfa (e. Complex Systems). með hjálp áhrifavaldslíkana (e. Agent-Based Modeling; ABM). Nemendur munu kynnast þróun, útbreiðslu og tilkomu tungumála með því að nota ABM til að líkja eftir og til að skilja hvernig einstakir áhrifavaldar tungumálsins vinna saman innan kerfis til að búa til flókin málfyrirbæri. Við munum skoða hvernig einfaldar reglur á míkróstigi geta leitt til flókinna mynstra á makróstigi ásamt því að skoða raunverulega notkunarmöguleika í sambandi við t.d. málbreytingar, mállýskumyndun og útbreiðslu nýjunga í tungumálum.
Viðfangsefni:
Grundvallaratriði í líkanagerð byggða á áhrifavöldum.
Tungumálakerfi sem flókin aðlögunarkerfi (e. Complex Adaptive Systems).
Hönnun og innleiðing áhrifavaldslíkana/ABM.
Rannsóknarverkefni (MLT002F)
Rannsóknarverkefni í máltækni. Nemandi vinnur sjálfstætt rannsóknarverkefni í samvinnu við leiðbeinanda. Mikilvægt er að hafa samband við greinarformann hafi nemandi áhuga á að taka rannsóknarverkefni.
- Haust
- Lokaverkefni
- Að meta og bæta málmyndandi líkön: Nálgun málfræðingsV
- GervigreindV
- Inngangur að djúpum tauganetumV
- RannsóknarverkefniV
- Vor
- Lokaverkefni
- Gagnaöflun og tölfræðiúrvinnsla í hugvísindum og máltækni VE
- Lífsferill gervigreindarlausnaV
- Áhrifavaldalíkön af máli í ljósi flókinna kerfaV
- RannsóknarverkefniV
Lokaverkefni (MLT401L)
Lokaverkefni
Að meta og bæta málmyndandi líkön: Nálgun málfræðings (MLT703F)
Hefur þú einhvern tímann velt fyrir þér hvernig málvísindamenn geta bætt risamállíkön (e. Large Language Models; LLMs)? Í þessu námskeiði munu nemendur kynnast því mikilvæga hlutverki sem málvísindamenn og sérfræðingar í tungumálum gegna þegar kemur að því að bæta textagerð gervigreindar. Námskeiðinu er ætlað að veita nemendum ítarlegan skilning og færni til að meta og bæta útkomu textagerðarlíkana sem notuð eru í mállíkönum með því að kafa ofan í margbreytileika tungumálsins eins og það er túlkað og framleitt með gervigreind. Sérstök áhersla verður lögð á málfræðilega þætti eins og setningafræði, merkingarfræði, málfræði og orðræðugreiningu.
Viðfangsefni: Grundvallaratriði í risamállíkönum: Uppbygging og textamyndunarferli risamállíkana Matsaðferðir: Fyrirliggjandi mælikvarðar og aðferðafræði til að meta gæði, samfellu og samhengislegt mikilvægi texta sem unninn er með gervigreind. Gagnasöfn fyrir markvissa fínstillingu: Að greina ákjósanleg gagnasöfn fyrir fínstillingu á risamállíkönum eftir sérstökum notkunartilvikum.
Gervigreind (REI505M)
Fjallað er um hugtök, aðferðir og reiknirit á sviði gervigreindar, með áherslu á studdan og óstuddan lærdóm. Forvinnsla og myndræn framsetning gagna. Mat á gæðum líkana og val á líkönum. Línuleg aðhvarfsgreining, næstu nágrannar, stoðvigravélar, tauganet, ákvarðanatré og safnaðferðir. Djúpur lærdómur. Þyrpingagreining og k-means aðferðin. Nemendur útfæra einföld reiknirit í Python og læra á sérhæfða forritspakka. Námskeiðinu lýkur með hagnýtu verkefni.
Inngangur að djúpum tauganetum (TÖL506M)
Í þessu námskeiði förum við yfir djúp tauganet og helstu aðferðir tengdar þeim. Kynnt verða net og aðferðir fyrir mynd, hljóð og textagreiningu. Lögð verður áhersla á hagnýtingu lausna og munu nemendur t.a.m. kynna verkefni eða grein á þessu sviði.
Rannsóknarverkefni (MLT001F)
Rannsóknarverkefni í máltækni. Nemandi vinnur sjálfstætt rannsóknarverkefni í samvinnu við leiðbeinanda. Mikilvægt er að hafa samband við greinarformann hafi nemandi áhuga á að taka rannsóknarverkefni.
Lokaverkefni (MLT401L)
Lokaverkefni
Gagnaöflun og tölfræðiúrvinnsla í hugvísindum og máltækni (ÍSL612M)
Á undanförnum árum hefur vægi gagnasöfnunar og tölfræðiúrvinnslu aukist í hugvísindum. Þetta kemur skýrt fram í undirgreinum á borð við sálfræðileg málvísindi (e. psycholinguistics), hugræna bókmenntafræði (e. cognitive literary studies) og tilraunaheimspeki (e. experimental philosophy). Þessi aukna áhersla á megindlega aðferðafræði í hugvísindum á sér stað á sama tíma og réttmæti rótgróinna tölfræðiaðferða er dregið í efa í öðrum greinum og hertar kröfur eru um að hægt sé að endurtaka rannsóknir og nálgast gögn í opnum aðgangi um leið og persónuverndar er gætt. Í þessu námskeiði munu nemendur rýna í vægi megindlegra aðferða í sínum greinum og fá þjálfun í öflun og úrvinnslu gagna. Fjölbreyttar rannsóknaraðferðir verða til umfjöllunar, allt frá greiningu textasafna yfir í skoðanakannanir og tilraunir þar sem skynjun áreita (svo sem orða, texta eða myndbrota) er mæld. Einnig verður farið yfir grunnhugtök og aðferðir í tölfræði svo nemendur þekki muninn á lýsandi tölfræði og ályktunartölfræði, skilji tölfræðilega marktækni og kunni að lesa úr myndrænni framsetningu gagna í gröfum. Lögð er áhersla á að nemendur spreyti sig undir leiðsögn kennara og bæði safni gögnum og greini þau. Nemendur vinna verkefni innan eigin fræðigreinar en kanna einnig grundvöll fyrir þverfaglegu samstarfi. Öll verkefni verða unnin í opnum hugbúnaði á borð við R Studio en engin fyrri þekking á forritinu né tölfræði er nauðsynleg. Námskeiðið hentar öllum nemendum á Hugvísindasviði sem vilja safna megindlegum gögnum til að svara áhugaverðum spurningum og gæti þannig reynst vel sem undirbúningur fyrir BA- eða MA-verkefni.
Lífsferill gervigreindarlausna (REI603M)
Í þessu námskeiði kynnumst við lífsferli gervigreindarlausna og hvernig þróa á rekstrarhæfar lausnir.
Við förum yfir eftirfarandi skref lífsferilsins:
- Gagnasöfnun og undirbúningur gagna
- Breytuval
- Þjálfun líkana
- Mat á gæðum líkana
- Líkön sett í rekstur
- Líkön sem þjónustur
- Hvernig vakta á líkön
- Hvernig viðhalda á líkönum
Yfir misserið verða þrjú stór verkefni þar sem nemendur keppa um að smíða gervigreindarlausnir.
Áhrifavaldalíkön af máli í ljósi flókinna kerfa (MLT806F)
Í þessu MA-námskeiði er kafað ofan í áhugaverða samþættingu gagnamálfræði (e. Computational Linguistics) og flókinna kerfa (e. Complex Systems). með hjálp áhrifavaldslíkana (e. Agent-Based Modeling; ABM). Nemendur munu kynnast þróun, útbreiðslu og tilkomu tungumála með því að nota ABM til að líkja eftir og til að skilja hvernig einstakir áhrifavaldar tungumálsins vinna saman innan kerfis til að búa til flókin málfyrirbæri. Við munum skoða hvernig einfaldar reglur á míkróstigi geta leitt til flókinna mynstra á makróstigi ásamt því að skoða raunverulega notkunarmöguleika í sambandi við t.d. málbreytingar, mállýskumyndun og útbreiðslu nýjunga í tungumálum.
Viðfangsefni:
Grundvallaratriði í líkanagerð byggða á áhrifavöldum.
Tungumálakerfi sem flókin aðlögunarkerfi (e. Complex Adaptive Systems).
Hönnun og innleiðing áhrifavaldslíkana/ABM.
Rannsóknarverkefni (MLT002F)
Rannsóknarverkefni í máltækni. Nemandi vinnur sjálfstætt rannsóknarverkefni í samvinnu við leiðbeinanda. Mikilvægt er að hafa samband við greinarformann hafi nemandi áhuga á að taka rannsóknarverkefni.
- Haust
- Línuleg algebraV
- Stærðfræðigreining IV
- Tölvur, stýrikerfi og tölvufærniV
- Vor
- Inngangur að gagnavísindumV
- Tölvur, stýrikerfi og tölvufærniV
- Stærðfræðigreining IIV
- Líkindareikningur og tölfræðiV
Línuleg algebra (STÆ107G)
Einingar til BS-prófs gilda aðeins fyrir annaðhvort REI201G Stærðfræði og reiknifræði eða STÆ107G Línuleg algebra.
Fjallað er um undirstöðuatriði línulegar algebru yfir rauntölurnar.
Viðfangsefni: Línuleg jöfnuhneppi,fylkjareikningur, Gauss-Jordan aðferð. Vigurrúm og hlutrúm þeirra. Línulega óháð hlutmengi, grunnar og vídd. Línulegar varpanir, myndrúm og kjarni. Depilfargfeldið, lengd og horn. Rúmmál í margvíðu hnitarúmi og krossfeldi í þrívíðu. Flatneskjur, stikaframsetning og fólgin framsetning. Hornrétt ofanvörp og einingaréttir grunnar. Aðferð Grams og Schmidts. Ákveður og andhverfur fylkja. Eigingildi, eiginvigrar og hornalínugerningur.
Stærðfræðigreining I (STÆ104G)
Þetta er grunnnámskeið um stærðfræðigreiningu í einni breytistærð. Æskilegur undirbúningur er að nemendur hafi lokið námskeiðum á framhaldsskólastigi sem fjalla um algebru, rúmfræði, hornaföll, diffrun og heildun. Námskeiðið leggur grunn að skilningi á greinum á borð við náttúrufræði, verkfræði, hagfræði og tölvunarfræði. Umfjöllunarefni námskeiðsins eru meðal annars:
- Rauntölur.
- Markgildi og samfelld föll.
- Deildanleg föll, reglur um afleiður, hærri afleiður, hagnýtingar deildareiknings (útgildisverkefni, línuleg nálgun).
- Torræð föll.
- Meðalgildissetning, setningar l'Hôpitals og Taylors.
- Heildun, ákveðin heildi og reiknireglur fyrir þau, stofnföll, óeiginleg heildi.
- Undirstöðusetning stærðfræðigreiningarinnar.
- Hagnýtingar heildareiknings: Bogalengd, flatarmál, rúmmál, þungamiðjur.
- Venjulegar afleiðujöfnur: fyrsta stigs línulegar diffurjöfnur, annars stigs línulegar diffurjöfnur með fastastuðlum.
- Runur og raðir, samleitnipróf.
- Veldaraðir, Taylor-raðir.
Tölvur, stýrikerfi og tölvufærni (TÖL108G)
Í þessu námskeiði er snert á mörgum hlutum sem tengjast tölvufærni. Markmið námskeiðsins er að kynna nemandann fyrir mörgum hugtökum án þess þó að kafa djúpt í hvert hugtak.
Kynning á stýrikerfinu Unix. Skipulag skráakerfis, helstu hjálparforrit, gluggakerfi, skipanalínuvinnsla og skeljarforritun. Einnig er farið yfir ritla í skelinni og höndlun gagna í henni. Farið er yfir útgáfustjórnunarkerfi eins og Git, notkun aflúsunaraðferða og aðferða til að byggja hugbúnað. Farið er yfir algeng hugtök í dulmálsfræðum og kynnt eru hugtök á borð við sýndarvélar og gáma.
Inngangur að gagnavísindum (REI202G)
Í námskeiðinu er fjallað um grunnaðferðir í gagnavísindum auk þess sem kennt er á forritasöfn á borð við numpy, pandas, matplotlib og scikit-learn.
Námskeiðið er í 6 hlutum:
- Kynning á Python forritunarmálinu.
- Umbreyting hrágagna á form sem auðvelt er að vinna með.
- Forkönnun á gögnum og myndræn framsetning á þeim.
- Bestun.
- Klösun og víddarfækkun.
- Aðhvarfsgreining og flokkun.
Hverjum hluta lýkur með verkefni.
Athugið að námslega skörun er við REI201G Stærðfræði og reiknifræði og geta bæði námskeiðin ekki gilt til sömu gráðunnar.
Tölvur, stýrikerfi og tölvufærni (TÖL205G)
Í þessu námskeiði er snert á mörgum hlutum sem tengjast tölvufærni. Markmið námskeiðsins er að kynna nemandann fyrir mörgum hugtökum án þess þó að kafa djúpt í hvert hugtak.
Kynning á stýrikerfinu Unix. Skipulag skráakerfis, helstu hjálparforrit, gluggakerfi, skipanalínuvinnsla og skeljarforritun. Einnig er farið yfir ritla í skelinni og höndlun gagna í henni. Farið er yfir útgáfustjórnunarkerfi eins og Git, notkun aflúsunaraðferða og aðferða til að byggja hugbúnað. Farið er yfir algeng hugtök í dulmálsfræðum og kynnt eru hugtök á borð við sýndarvélar og gáma.
Stærðfræðigreining II (STÆ205G)
Í námskeiðinu er fengist við stærðfræðigreiningu falla af mörgum breytistærðum. Helstu hugtök sem koma vip sögu eru:
Opin mengi og lokuð. Varpanir, markgildi og samfelldni. Deildanlegar varpanir, hlutafleiður og keðjuregla. Jacobi-fylki. Stiglar og stefnuafleiður. Blandaðar hlutafleiður. Ferlar. Vigursvið og streymi. Sívalningshnit og kúluhnit. Taylor-margliður. Útgildi og flokkun stöðupunkta. Skilyrt útgildi. Fólgin föll og staðbundnar andhverfur. Ferilheildi, stofnföll. Heildun falla af tveimur breytistærðum. Óeiginleg heildi. Setning Greens. Einfaldlega samanhangandi svæði. Breytuskipti í tvöföldu heildi. Margföld heildi. Breytuskipti í margföldu heildi. Heildun á flötum. Flatarheildi vigursviðs. Setningar Stokes og Gauss.
Líkindareikningur og tölfræði (STÆ203G)
Grundvallarhugtök í líkindafræði og tölfræði, stærðfræðileg undirstaða þeirra og beiting með tölfræðihugbúnaðinum R.
- Líkindi, slembistærðir og væntigildi þeirra
- Mikilvægar líkindadreifingar
- Úrtök, lýsistærðir og úrtaksdreifing lýsistærða
- Metlar og öryggisbil
- Hugmyndafræði tilgátuprófa
- Mikilvæg tilgátupróf
- Línuleg aðhvarfsgreining
Hafðu samband
Þjónustuborð Hugvísindasviðs
s.525 4400 hug@hi.is.
Opið virka daga frá kl 10:00–12:00 og 13:00–15:00.
3. hæð Aðalbyggingar.
Sæmundargötu 2, 102 Reykjavík.
Nemendur á Hugvísindasviði geta einnig nýtt sér þjónustuborð á Háskólatorgi.
Fylgstu með Hugvísindasviði
Hjálplegt efni
Ertu með fleiri spurningar? Hér finnurðu svör við ýmsum þeirra og upplýsingar um ýmislegt annað sem gott er að hafa í huga þegar þú velur nám.