Daten-Sortierungs-Wahn :)

Hier kann über allgemeine Themen diskutiert werden, die sonst in kein Forum passen.
Insbesondere über Szene, Games, Kultur, Weltgeschehen, Persönliches, Recht, Hard- und Software.
Antworten
Benutzeravatar
starcow
Establishment
Beiträge: 565
Registriert: 23.04.2003, 17:42
Echter Name: Mischa Schaub
Wohnort: Zürich
Kontaktdaten:

Daten-Sortierungs-Wahn :)

Beitrag von starcow »

Hallo geschätzte ZFX'ler :>

Ich bins mal wieder, mit einer Frage an die Experten :-)

Es geht mir um Ueberlegungen zu Sortierungs-Konzepten und der Namensgebung von Dateien.
Ich für mich stelle immer wieder fest, dass das Konzept vom bekannten Order Prinzip bei zunehmender Datei-Anzahl problematisch wird.
Es tritt einfach schnell die Situation auf, in welcher sich nicht klar Entscheiden lässt, in welche Gruppe (Order) eine Datei einzuordnen ist, da solche Ordner-Hierarchien oftmals in "entweder-oder" Situationen münden.
Zudem wird die Situation schnell problematisch, wenn Dateien als Resource in andere Dateien oder Programmen eingebunden werden. Ab diesem Zeitpunkt, kann man die entsprechende Datei nicht einfach ohne weiteres verschieben oder umbenennen. Verschärfend kommt noch hinzu, dass ich nicht immer wissen kann, welche Datei wo eingebunden ist, da die Datei selbst nicht darüber bescheid weiss. Es müsste doch ein System geben, bei welchem ich eine Datei einfach einer anderen Gruppe zuteilen kann, ohne mir Gedanken darüber zu machen, dass ich möglicherweise an einer anderen Stelle einen "Konflikt" auslöse.
Eine weitere Schwachstelle beim gängigen Ordner-Konzept: Sehr oft sind Informationen - um was es sich für eine Datei handelt - ausschliesslich in der Ordner-Struktur enthalten.
Als Beispiel eine Datei Namens protokoll.txt. Ohne den Kontext der Ordner-Struktur fehlt die Information darüber, was die Datei genau beinhaltet. Oder anders ausgedrückt: Kopiere ich die Datei auf einen Stick, fehlen mir wesentliche Informationen. Natürlich kann man jetzt weitere Informationen in den Dateinamen mit aufnehmen, nur wird dann dass eigentliche Ordner-Konzept zur rein kosmetischen Sache. Denn wenn eine Datei die ganze Information der Ordner-Struktur in ihrem Dateinamen abbildet, kann man die Ordner eigentlich auch gleich weglassen und alles auf c:/ kopieren :-)

Wie lösen das den z.B. grössere Firmen, bei welchen unzählige Leute Dateien erstellen, bearbeiten und löschen.
Meine Idee wäre eine art Datenbank. Jede Datei bekommt bei seiner Erzeugung eine unique ID zugeteilt, anhand welcher sie immer verlässlich eingebunden werden kann. Mit setzen von Flags könnte man - entgegen dem bekannten Ordner-Prinzip - Zuteilungen in verschiedene Gruppe vornehmen.
Wichtig wäre mir noch, dass man immer in der Datei selbst erkennen kann, wo diese eingebunden ist.

Gibt es vielleicht schon solche Systeme, die ihre Daten so oder ähnlich verwalten?

Gruss starcow
Freelancer 3D- und 2D-Grafik
mischaschaub.com
Benutzeravatar
xq
Establishment
Beiträge: 1590
Registriert: 07.10.2012, 14:56
Alter Benutzername: MasterQ32
Echter Name: Felix Queißner
Wohnort: Stuttgart & Region
Kontaktdaten:

Re: Daten-Sortierungs-Wahn :)

Beitrag von xq »

Ich hab auch schon über sowas nachgedacht. Falls ich Dateien an mehreren Orten benötige, benutze ich Hard Links bzw. bind-Punkte unter Linux bzw. Directory Junctions unter Windows.

Ich weiß, dass es deine Frage nicht konkret beantwortet, löst aber das eine Problem, dass Dateien "nur in einem Ordner" liegen müssen

Ansonsten haben wir auf Arbeit (Uni-Institut) ein heilloses Chaos, wenn Dateien nicht Projektgebunden sind, ansonsten liegen die Dateien in einer Struktur "Projekte/$Auftragsgeber/$Projektname", wobei bei multiplen Auftragsgebern auch keine Lösung existiert
War mal MasterQ32, findet den Namen aber mittlerweile ziemlich albern…

Programmiert viel in ⚡️Zig⚡️ und nervt Leute damit.
NytroX
Establishment
Beiträge: 396
Registriert: 03.10.2003, 12:47

Re: Daten-Sortierungs-Wahn :)

Beitrag von NytroX »

Hm, interessantes Thema, hab ich auch schonmal drüber nachgedacht.
Was ich cool fände, wäre quasi ein Taggen der Dateien und Ordner.
Dann lässt sich danach einfacher suchen, insbesondere bei solchen "gehört zu mehreren Gruppen" Sachen.
(AFAIK würden Tags in den meisten Dateisystemen sogar schon gehen, wenn die Tools das unterstützen würden)

Aber ich habe das Problem auch, viele Dateien lassen sich als Tree schlecht organisieren, eine Art Directed Acyclic Graph wäre wohl besser.
Insbesondere könnte man damit auch Abhängigkeiten ordentlich darstellen, das vermeidet die Dependency Hell komplett, wenn man dann noch einen Software/Package-Manager hätte.

Und ja, was Master sagt kann ich definitiv bestätigen, bei größeren Firmen herrscht einfach entsprechend größeres Chaos, was Dateiverwaltung angeht; da wurde gar nichts gelöst.
In großen Firmen kann man froh sein wenn Projekte wenigstens eine Versionierung verwenden und nicht eine "Konzept_V1.doc", "Konzept_V2.doc", usw. einfach auf einem Windows-Share rumfliegen lassen.

Ich weiß nicht in wie weit Datenbank-Filesysteme sowas lösen können, aber die meisten Projekte dahingehend sind glaube ich nicht weiter verfolgt worden.
Benutzeravatar
xq
Establishment
Beiträge: 1590
Registriert: 07.10.2012, 14:56
Alter Benutzername: MasterQ32
Echter Name: Felix Queißner
Wohnort: Stuttgart & Region
Kontaktdaten:

Re: Daten-Sortierungs-Wahn :)

Beitrag von xq »

Die Frage ist eben auch noch eine Frage der Handhabung:
Aktuelle Dateisysteme sind halt darauf ausgelegt, maximal einfach bedient zu werden. "Datei XYZ in Ordner UVW erstellt, dann liegt die da auch."
Wie strukturiere ich zum Beispiel mein Betriebssystem mit all den tausenden Programmen, die darauf installiert sind? Landen alle Dateien eines Programmes in einer Gruppe, alle ausführbaren Dateien in einer anderen Gruppe?

Was eine wirklich sinnvolle Änderung wäre: Weg von "Kurzen" Datei-Endungen hin zu MIME, um einfache Zuweisungen machen zu können. Wobei hier auch eine Erweiterung um ein Anwendungsfeld sinnvoll wäre (damit logische XML-Dateien mit unterschiedlicher Semantik auch von unterschiedlichen Programmen geöffnet werden)
War mal MasterQ32, findet den Namen aber mittlerweile ziemlich albern…

Programmiert viel in ⚡️Zig⚡️ und nervt Leute damit.
mrz
Beiträge: 79
Registriert: 07.08.2008, 14:34

Re: Daten-Sortierungs-Wahn :)

Beitrag von mrz »

>> Wie lösen das den z.B. grössere Firmen, bei welchen unzählige Leute Dateien erstellen, bearbeiten und löschen.

Die Nutzen ein Document Management System, kurz DMS.
Wir verwenden z.B. Alfresco.
Solche Systeme haben auch ein Version Control System (VCS)
womit man die History von einem Dokument anschauen kann so wie man das von anderen Source VCS z.B. SVN/GIT/Mercurial etc kennt.

"Gruppieren" (wenn man es überhaupt noch so nennen möchte) tut man in solchen Systemen mit "Tags" oder "Labels".
Jedes Dokument kann N Tags/Labels haben und man ist somit nicht mehr an eine fixe Hierarchie
oder entwerder-oder Entscheidung eingeschränkt.

DMS bieten natürlich noch viele weitere Vorteile z.B. Berechtigungssystem
oder auch Lockmechanismen (Multiuser) wo man mit einem Filesystem nicht mal eben abbilden kann.

Wenn ich das von MasterQ32 lese dass ne Uni einfach so mit Dateien rumhantiert dann wird es mir übel.
Benutzeravatar
Krishty
Establishment
Beiträge: 8336
Registriert: 26.02.2009, 11:18
Benutzertext: state is the enemy
Kontaktdaten:

Re: Daten-Sortierungs-Wahn :)

Beitrag von Krishty »

Dass das Ordner-Datei-Konzept verloren hat, sieht man ja am Internet. Wenn ich meinen Visual C++-Bug auf ZFX wiederfinden will, merke ich mir ja auch nicht die Thread-ID und navigiere dahin, sondern tippe in Google die Stichpunkte ein, die mir noch im Gedächtnis sind, und lasse mich hinführen. In Outlook sortiere ich meine Post auch nicht in 1000 Ordner, sondern wenn ich was suche, tippe ich Stichpunkte in die Suche, und lasse es mir anzeigen.

Und sowas fehlt auf dem Desktop halt. Früher gab's Google Desktop Search, aber das wurde eingestellt. Die lächerliche Nutzlosigkeit der Windows-Dateisuche ist auch kein Geheimnis. Mit einer vernünftigen Lösung (insbesondere Texterfassung in Bilddateien, weil die halbe Welt ihre Facebook-Sprüche in JPEG backt!) würde ich einfach nur noch alle Dateien mit UID auf die Platte klatschen, jede Änderung würde eine neue Datei bewirken (Copy-on-Write?) und alle Probleme wären gelöst.

[AFAIK nutzen auch große Baufirmen und Anwaltskanzleien heute Google-ähnliche Suchen für ihre Datenberge. {Nachtrag: Ja, siehe mrz oben.} Dass man sowas mit Cloud automatisch bekommt, ist IMHO einer der wenigen Vorteile.]
seziert Ace Combat, Driver, und S.T.A.L.K.E.R.   —   rendert Sterne
Benutzeravatar
Schrompf
Moderator
Beiträge: 5114
Registriert: 25.02.2009, 23:44
Benutzertext: Lernt nur selten dazu
Echter Name: Thomas
Wohnort: Dresden
Kontaktdaten:

Re: Daten-Sortierungs-Wahn :)

Beitrag von Schrompf »

Auf der Festplatte hatte ich das Problem irgendwie noch nie. Aber mir fällt dazu ein, dass es für Selbständige usw. Software gibt, mit der man alle Belege, Rechnungen und so scannt und optional ein paar Stichworte dazu gibt. Die Software selbst lässt zusätzlich Schrifterkennung drüberlaufen, und indiziert das Ganze. Das lässt sich sicher auch auf Dokumentdateien aller Art anwenden.

Auf Arbeit benutzen wir Confluence - ne Art Wiki, dessen großer Vorteil aber die Fähigkeit ist, auch PDF- und Word-Dokumente indizieren zu können. Es führt natürlich trotzdem kein Weg an einer gewissen Gruppierung vorbei, und natürlich geht auch die Suchfunktion recht bald in die Knie, wenn ein Großteil der Texte sehr formell formuliert ist. Aber es reicht immerhin etwas weiter als ein Notizblock.

Philosophisch betrachtet: Du schiebst die Chaosgrenze nur immer weiter raus, aber vermeiden kannst Du sie nie. Zuerst gab's Gruppierung wie z.B. Ordner oder Indizierungen wie Stichwortverzeichnisse, dann gab's Suchfunktionen, dann semantische Gewichtung. Keine Ahnung, was als Nächstes kommt, aber es wird immer nur ein Aufschub bleiben.
Früher mal Dreamworlds. Früher mal Open Asset Import Library. Heutzutage nur noch so rumwursteln.
Antworten