Типовые потери при работе с базой знаний

Специалист у которого имеется развитая база знаний значительно отличается от специалиста без таковой. Он может сходу найти решение некоторой проблемы, которая когда-то вставала перед ним. Он может выдать с десяток решений задачи в своей области, в то время как “обычный” специалист ограниченный своими психофизиологическими параметрами редко когда может вспомнить более трех сходу.

Концепт потерь

В производственной практике Toyota впервые пришли к выводу что запасы продукции хранить неэффективно по следующим причинам :

- они занимают место;
- со временем портятся;
- могут так и остаться невостребованными;
- могут требовать обслуживания во времени;
- ... 

И кроме запасов есть ряд других возможных потерь. Можно ли перенести концепт потерь на работу с базой знаний?

Похоже, что во многом - да. Кроме того как показывает практика если таких потерь накапливается достаточно много, то база знаний превращается из инструмента который позволяет решать задачи в гору мусора.

Разберем ряд возможных потерь.

Добавление объектов которые нельзя использовать

Ошибка заключается в том чтобы добавлять в базу знаний данные, которые не отвечаются на вопрос “как сделать?” и не могут быть применены для решения хоть каких-нибудь задач. Такие знания можно назвать декларативными.

Неочевидных признаков по которым заранее можно сказать что пример нефактурен существует множество. На эту тему можно изучить следующую лекцию.

Неоптимальный размер заметки-примера

Неоптимальные по размеру заметки являются ,как правило, слишком большими или слишком маленькими.

Почему плохи маленькие заметки?

Дело в том что каждая заметка аналогично запасам продукции следуя практике Toyota создает некоторые издержки :

- ее нужно как-то назвать;
- в процессе "использования" она перечитывается как минимум несколько раз;
- ее нужно положить в нужную категорию или правильно протэгировать;

Каждый кто вел свою базу знаний может дополнить этот список. Маленькие заметки же обычно не содержат в себе достаточной ценности для того чтобы быть выделенными и сохраненными потому, потому как не перекрывают создаваемые издержки.

Если у Вас появилась идея, то Вы стали беднее (с) А. Лебедев

Вышеприведенную мысль можно перефразировать так : если Вы добавили что-то в базу знаний, то Вы заняли время у себя в будущем.

Основная рекомендация тут - не добавлять в базу знаний что-то состоящее из одного-двух предложений.

Почему плохи слишком большие заметки?

Под “большими” я понимаю - более 10 страниц. Если это прямая цитата из текста, то скорее всего там либо :

- есть несколько ключевых моментов, и тогда их нужно разделить на отдельные примеры;
- есть структура, и тогда текст следует переформатировать в соответствии с ней. Например, сделать реферат;

В противном случае мы всегда получаем очень долгий доступ к нужной информации.

Недоступные или сложно доступные для поиска объекты

Если у Вас часто случаются ситуации, когда вы точно помните что некоторая запись в базе была, но никак не можете найти ее то это именно этот тип потерь.

Причин тому может быть много, но я рассмотрю тут одну из наиболее неочевидных: объектная категоризация вместо функциональной ( я узнал об этой ошибке на курсе КЧУК ).

Вот как выглядит часть объектной категоризации :

Объектная категоризация

Вот как выглядит часть функциональной категоризации :

Функциональная категоризация

Основой первой является - объект (“Что?”), основой второй - функция (“Что сделать?”). А теперь представим что перед нами встает некоторая сложная задача. В сложных задачах область постановки и область решения мало когда совпадает.

Поэтому в первом случае решения задачи могут быть найдены в самых разных категориях и получить к ним доступ можно только перерывая всю базу. Во втором же как правило достаточно посмотреть 1-2 нужных функции которые могут содержать заметки из самых разынх объектных категорий.

Складируемые материалы

Текстовые документы почти не занимают место на диске компьютера, но все же могут являться потерями. Почему?

Основная причина что непроработанные источники и заметки могут содержать что-то, что направит исследование/проект в совершенно другое русло. Направление может смениться в результате постановки нового вопроса, либо неочевидной задачи.

Другими словами - если некоторый вывод может быть сделан, но он не сделан то это потери.

Либо можно начать глубоко копать в области, в которой глубоко копать не стоит. Так если некоторый исследователь бездумно читает десятки книг по таймменеджменту и глубоко не анализирует их, то он может не заметить что сильных решений задачи самоорганизации там нет. А есть только несколько повторяющихся ошибок которые кочуют из книги в книгу. Почти то же самое происходит если источники даже не прорабатывать, а просто складировать ссылки на них.

Различные повторы и самоповторы

Этот вариант потерь также принимает множество различных форм, например :

- проработка одного и того же источника дважды; 
- продумывание одной и той же мысли дважды, возможно в разных формах;
- повторение одних и тех же ошибок которых можно было бы избежать с помощью базы знаний;  

Способов избежать этого также очень много, но основное направление тут - добавление некоторой метаинформации к разным видам заметок, чтобы близки по смыслу действия/записи располагались рядом в базе.

Отсутствие выводов n-го уровня из имеющихся материалов

Этот тип потерь очень похож на “складируемые материалы” за тем исключением что здесь выводы делаются из уже имеющихся выводов, которые тоже могут быть очень ценны.

Наиболее распространенной системой которая позволяет делать подобные “фрактальные выводы” является Zettelcasten Никласа Лумана.

Добавление популярных или искаженных пересказов первоисточников

Материалы которые значительно искажают рассматриваемое явление фактически являются почти бесполезными. Но в то же время, как было показано выше, они создают значительные издержки связанные с обработкой такой информации.

Существует один эффект на который я лично напоролся и который меня лично многому научил. Ещё будучи в школе я выписывал огромное количество журналов: “Наука и жизнь”, “Знание - сила”, “Техника молодёжи” и прочее.
На основании этого я составлял некоторую бумажную картотеку. И мне казалось что бумажная картотека это здорово. К сожалению на данный момент это всё фактически нерабочее. Потому что уже после ВУЗа я начал читать академическую литературу по тем же темам. И выяснилось что в популярных журналах присутствуют очень большие искажения и очень большие упрощения. Реальность намного сложнее. И весь тот материал на который были потрачены бессонные ночи, время, деньги представляет собой небольшую ценность. Скорее как сборник ошибок.

Источник , Автор : Викентьев И. Л.

Отсутствие точных цитат

А также ссылок на первоисточники.

При этом есть риск что в базу будет добавлено не “что имел ввиду Автор”, а “как я понял автора?”. И на основе этого будут строиться дальнейшие выводы, а может быть и разработка которая может разрушиться по принципу карточного домика.

Имеет смысл ознакомиться с материалом : Почему корректные ссылки - это выгодно.

При этом важно - я не хочу умалять эффекта лучшего усвоения материала вследствие активной работы с ним и его переформулировок/переструктуризации. Но лучше этот подход совмещать с точным цитированием.

Внеструктурная информация

И последний тип потерь - это объекты которые ниходятся вне используемой вами системы. Они просто не создают никакой ценности, и поэтому их нужно постоянно отслеживать.

Теряется «внеструктурная» информация. Когда мы не знаем, в какую папку положить документ, мы не кладем его ни в одну.

Источник , Автор : Сидорин А.

Нужно явно отработать алгоритм что делать с потенциально внеструктурной информацией. Одно из решений - создавать очень обобщенные тэги/категории и высылать Коллегам которые занимаются похожими темами.