← Zurück zum Blog

Wissenschaftliche Paper als sauberes Markdown in Obsidian speichern

· Save Team
obsidianacademicresearchstudentsmarkdownliterature-review

Akademische Forschung bedeutet, Dutzende --- manchmal Hunderte --- von Papern, Artikeln und Blogbeitraegen zu lesen. Die meisten Forschenden setzen Lesezeichen, verlieren sie und googeln dasselbe ein zweites Mal.

Obsidian loest das Speicherproblem. Aber Webinhalte sauber in Obsidian zu bekommen? Da scheitern die meisten Workflows.

So bauen Sie eine Recherche-Pipeline, die Webquellen in eine durchsuchbare, vernetzte Wissensbasis verwandelt.

Das Problem mit akademischem Web Clipping

Forschungsinhalte sind ueberall verstreut:

  • Paper auf arXiv, Google Scholar, PubMed, SSRN
  • Blogbeitraege, die komplexe Konzepte verstaendlich erklaeren
  • Dokumentation fuer Tools, Frameworks und Datensaetze
  • Threads auf Reddit, Twitter und Stack Overflow mit praktischen Erkenntnissen

Jede Quelle hat ein anderes Layout, anderes Rauschen und andere Formatierung. Copy-Paste in Obsidian ergibt einen Wust aus kaputter Formatierung, fehlenden Bildern und uebrig gebliebenen Navigationselementen.

Der saubere Recherche-Workflow

Schritt 1: Mit Save erfassen

Saves KI-Extraktion uebernimmt den schwierigen Teil --- chaotische Webseiten in sauberes, strukturiertes Markdown umwandeln:

  1. Navigieren Sie zur Paper-, Artikel- oder Dokumentationsseite
  2. Klicken Sie auf die Save-Erweiterung
  3. Laden Sie die .md-Datei herunter

Was Sie erhalten:

  • Saubere Ueberschriften-Hierarchie entsprechend der Struktur des Papers
  • Erhaltene Code-Bloecke fuer technische Inhalte
  • Korrekte Listen und Tabellen in Standard-Markdown formatiert
  • Keine Werbung, Seitenleisten oder Cookie-Banner

Schritt 2: In Ihren Recherche-Vault einordnen

Organisieren Sie Ihren Vault nach Forschungsbereichen:

research-vault/
  literature/
    machine-learning/
    distributed-systems/
    human-computer-interaction/
  notes/
    concepts/
    methods/
    findings/
  projects/
    thesis/
    paper-draft/
  meta/
    reading-list.md
    literature-review-matrix.md

Schritt 3: Forschungsmetadaten hinzufuegen

Fuegen Sie nach dem Speichern Frontmatter zu jeder geclippten Quelle hinzu:

---
title: "Attention Is All You Need"
authors: ["Vaswani et al."]
year: 2017
source: "https://arxiv.org/abs/1706.03762"
type: paper
status: read
tags: [transformers, attention, nlp]
rating: 5
---

Diese Metadaten bilden die Grundlage fuer Obsidians Dataview-Plugin bei Literaturuebersicht-Abfragen (mehr dazu weiter unten).

Schritt 4: Kernerkenntnisse extrahieren

Nicht nur speichern --- verarbeiten. Erstellen Sie fuer jede Quelle oben einen Zusammenfassungsabschnitt:

## Meine Zusammenfassung
- Fuehrt die Transformer-Architektur ein, ersetzt RNNs durch Self-Attention
- Kernerkenntnis: Aufmerksamkeitsmechanismen allein (ohne Rekurrenz) koennen
  Sequence-to-Sequence-Aufgaben bewaeltigen
- Ermoeglicht massive Parallelisierung beim Training
- Grundlage fuer BERT, GPT und alle modernen LLMs

## Wichtige Zitate
- [konkrete Seiten-/Abschnittsverweise]

## Relevanz fuer meine Arbeit
- Direkt anwendbar auf [Ihr Projekt/Thesis-Thema]
- Widerspricht [anderer Quelle] in Bezug auf [bestimmten Punkt]

Eine Literaturuebersicht erstellen

Die Matrix-Methode

Erstellen Sie eine Literaturuebersicht-Matrix in Obsidian:

# Literaturuebersicht-Matrix: Transformer-Architekturen

| Paper | Jahr | Hauptbeitrag | Methode | Ergebnisse | Relevanz |
|-------|------|-------------|---------|------------|----------|
| [[literature/attention-is-all-you-need]] | 2017 | Self-Attention | Architektur | Uebertrifft RNNs | Grundlage |
| [[literature/bert-pre-training]] | 2018 | Bidirektionales Pre-Training | Pre-Training | SOTA bei 11 Tasks | Methode |
| [[literature/gpt-scaling-laws]] | 2020 | Skalierungsgesetze | Empirisch | Vorhersagbare Skalierung | Kontext |

Jeder Eintrag verlinkt zur vollstaendig geclippten Quelle in Ihrem Vault. Klicken Sie durch, um das Original zu lesen, wenn Sie Details brauchen.

Dataview-Abfragen

Mit dem Dataview-Plugin koennen Sie Ihre Forschung programmatisch abfragen:

TABLE authors, year, rating, status
FROM "literature"
WHERE contains(tags, "transformers")
SORT year DESC

So erhalten Sie eine dynamische Literaturtabelle, die sich automatisch aktualisiert, wenn Sie neue Quellen hinzufuegen. Filtern Sie nach Status, Bewertung, Jahr oder jedem anderen Metadatenfeld.

Tipps fuer verschiedene Quellentypen

arXiv-Paper

arXiv-HTML-Seiten lassen sich gut mit Save clippen. Abstract, Abschnitte und Referenzen werden in sauberes Markdown umgewandelt. Fuer reine PDF-Paper clippen Sie die arXiv-Abstractseite und notieren den PDF-Link im Frontmatter.

Google Scholar

Clippen Sie die Landingpage des Papers fuer Metadaten. Folgen Sie dem Link zum Volltext (oft auf der Verlagsseite oder arXiv) fuer den vollstaendigen Inhalt.

Technische Blogbeitraege

Blogbeitraege von Forschenden erklaeren ihre Paper oft in verstaendlicher Sprache. Das ist Gold --- speichern Sie sowohl das Paper als auch den erklaerenden Blogbeitrag und verlinken Sie sie:

Siehe auch: [[literature/transformers-blog-explained]] (verstaendliche Erklaerung)

Dokumentation und Tutorials

Technische Dokumentation (PyTorch, TensorFlow, scikit-learn) ist Referenzmaterial, auf das Sie immer wieder zurueckkommen. Einmal speichern, unter dem jeweiligen Tool ablegen und aus Ihren Projektnotizen verlinken.

Kollaborations-Workflow

Wenn Sie in einer Forschungsgruppe arbeiten:

  1. Jede Person clippt und verarbeitet Quellen in ihrem eigenen Vault
  2. Verarbeitete Zusammenfassungen (Frontmatter + Zusammenfassungsabschnitt) per Git oder geteiltem Ordner teilen
  3. Ergebnisse in einer gemeinsamen Literaturuebersicht-Matrix zusammenfuehren

Das Markdown-Format macht das Teilen trivial --- keine proprietaeren Formate, keine Kompatibilitaetsprobleme.

Das lange Spiel

Ein Doktorand, der 5 Quellen pro Woche clippt und verarbeitet, hat nach einem Jahr ueber 250 gut organisierte, durchsuchbare Notizen. Wenn es ans Schreiben geht:

  • Literaturuebersichten schreiben sich praktisch von selbst aus Ihrer Matrix und Ihren Dataview-Abfragen
  • Zitate sind leicht zu finden --- durchsuchen Sie Ihren Vault, nicht Google
  • Verbindungen zwischen Papern sind in Obsidians Graph-Ansicht sichtbar
  • KI-Agenten koennen ueber Ihre gesamte Forschungsbasis hinweg synthetisieren ueber MCP

Die Zeit, die Sie in sauberes Clippen und Organisation investieren, zahlt sich beim Schreiben exponentiell aus.

Erste Schritte

  1. Installieren Sie Save und erstellen Sie Ihren Recherche-Vault
  2. Waehlen Sie 3 Paper oder Artikel, die Sie kuerzlich gelesen haben
  3. Clippen Sie sie mit Save, fuegen Sie Frontmatter hinzu und schreiben Sie eine Zusammenfassung
  4. Verlinken Sie sie untereinander, wo relevant
  5. Spueren Sie den Unterschied zwischen organisierter Forschung und einem Haufen Lesezeichen