Während des Coli-Studiums trifft man auf vielerlei Herausforderungen konzeptueller und technischer Art. Glücklicherweise gibt es im World Wide Web eine Vielzahl an Ressourcen, die bei der Bewältigung helfen können.
Diese Liste ist ein Versuch, einen Überblick über Ressourcen zu bieten, von denen wir selbst profitiert haben.
Es tauchen verschiedene Arten von Ressourcen auf:

Coli-Infrastruktur

Versionskontrolle

Da git zurzeit das meistgenutzte Versionskontrollsystem ist, unterhält die Gruppe Technik eine GitLab-Instanz. GitLab ist ähnlich wie GitHub. Ihr könnt dort eigene Projekte anlegen und mit anderen zusammen daran arbeiten.

Die Gruppe Technik unterhält auch eine Web-Oberfläche für das Versionskontrollsystem SVN, die aber wenig genutzt wird.

Korpora, Parser etc.

Die Wikiseite über die verfügbaren Ressourcen erklärt dazu alles Nötige. (Zumindest theoretisch.)

Server

Für Studierende nutzbare Server:

Technik-Tutorial der GT

Die Gruppe Technik hat viel Wissenswertes zur Infrastruktur auf Ihrer Wikiseite zusammengefasst.

Coli-News

Web-Werkzeuge

Tutorials und Übersichten

Programmieren und Automatisieren

Bash

Obwohl die Shell (und speziell Bash) wichtig für alltägliche Datenverarbeitungs- und Programmieraufgaben ist, gibt es (außer einem Tag im Ressourcenvorkurs) keine Einführung in das Thema. Selbststudium ist hier zu empfehlen.

Computerlinguistik

Texte verfassen

Python-Bibliotheken

Oft weiß man nicht, welche Pythonmodule überhaupt existieren und versucht, die Funktionalität selbst zu implementieren.
Dies geht auch einfacher, weswegen wir hier eine (eventuell wachsende) Übersicht an interessanten Python-Bibliotheken geben.

Stringmatching

Spracherkennung

Statistische Module

Textverarbeitung

Scraping

Homepages

Deep Learning

Textextraktion

Geiler Shit

Visualisierung