waspono (waspono) wrote,
waspono
waspono

Куда кривая вывезла

.



Г. С. Мурашева
доцент М. Г.У
КРИВАЯ ОШИБОК
И
ПОНЯТИЕ СЛУЧАЙНОСТЕЙ



Это мой любимый советский фильм «Сердца четырёх». По фильму это название книжки, написанной старшей из сестёр.


Монтаж картины был завершён буквально накануне начала Великой Отечественной войны. Выход столь «легкомысленной» ленты, в которой командир Красной армии был водевильным персонажем, в тяжелейшее для страны время сочли неуместным, и картину выпустили в прокат лишь 5 января 1945 года, когда разгром нацистов был уже лишь делом времени.
https://ru.wikipedia.org/wiki/Сердца_четырёх


А у «легкомыслия» оказался неожиданный поворот :) .


ROC-кривая (англ. receiver operating characteristic, рабочая характеристика приёмника) — график, позволяющий оценить качество бинарной классификации, отображает соотношение между долей объектов от общего количества носителей признака, верно классифицированных как несущих признак, (англ. true positive rate, TPR, называемой чувствительностью алгоритма классификации) и долей объектов от общего количества объектов, не несущих признака, ошибочно классифицированных как несущих признак (англ. false positive rate, FPR, величина 1-FPR называется специфичностью алгоритма классификации) при варьировании порога решающего правила.
[…]
Задача классификации состоит в том, чтобы относить ранее неизвестные сущности к тому или иному классу. Примером такой задачи может быть постановка диагноза по медицинским анализам. В этом случае есть два класса результатов: положительный (positive) и отрицательный (negative). Тогда на выходе классификатора может наблюдаться четыре различных ситуации:
* Если результат классификации положительный, и истинное значение тоже положительное, то речь идет об истинно-положительном значении (true-positive, TP)
* Если результат классификации положительный, но истинное значение отрицательное, то речь идет о ложно-положительном значении (false-positive, FP)
* Если результат классификации отрицательный, и истинное значение тоже отрицательное, то речь идет об истинно-отрицательном значении (true-negative, TN)
* Если результат классификации отрицательный, но истинное значение положительно, то речь идет о ложно-отрицательном значении (false-negative, FN)
* […]
ROC-кривые впервые использованы в теории обработки сигналов в США во время Второй мировой войны для повышения качества распознавания объектов противника по радиолокационному сигналу[1]. После атаки на Перл Харбор в 1941 году, американские военные начали новые исследования, направленные на попытки увеличения точности опознавания японских самолетов по радиолокационным сигналам.
https://ru.wikipedia.org/wiki/ROC-кривая


Наряду с FPR и TPR используют также показатели чувствительности и специфичности, которые также изменяются в интервале

:
* чувствительность алгоритма

* совпадает с

* ;
* специфичность алгоритма

* определяется как

* .
Модель с высокой чувствительностью часто дает истинный результат при наличии положительного исхода (обнаруживает положительные примеры). Наоборот, модель с высокой специфичностью чаще дает истинный результат при наличии отрицательного исхода (обнаруживает отрицательные примеры). Если рассуждать в терминах медицинской диагностики, где модель классификации пациентов на больных и здоровых называется диагностическим тестом, то получится следующее:
* чувствительный диагностический тест проявляется в гипердиагностике – максимальном предотвращении пропуска больных;
* специфичный диагностический тест диагностирует только доподлинно больных. Это важно в случае, когда, например, лечение больного связано с серьезными побочными эффектами и гипердиагностика пациентов нежелательна.
http://www.machinelearning.ru/wiki/index.php?title=ROC-кривая


Чертовщинка какая-то, да :) ?

Или … Big Data :).
Только ОЧЕНЬ БОЛЬШИЕ Data.
Что-то такое (сверх понимания человека) носилось в воздухе … Прорывалось … Даже в водевильчике. (Где-то ведь взято было столь причудливое название для книжки! Была область математики/, интересовавшаяся Темой. И здесь, и там. Вот в оперетте «Летучая мышь» представить такую книжку как-то сложнее *.). Разумеется, понято не было. Да и не могло быть понято. Но след - остался …

*
Не только там. Неявно предполагается наличие определённого достигнутого уровня знаний. В определённого же уровня развития странах. Появление Годдарда (США), Циолковского (Россия) и Оберта (Германия) было практически синхронным. В Северо-Западной Пограничной провинции или Ньясаленде ничего подобного (тогда) возникнуть не могло. Никогда! Уровень не тот.
Поскольку уровень этот - величина динамическая (раз достигнутое может быть утеряно (спутники стали падать чаще прежнего), а недостижимое вдруг стало достигаться), самое интересное - это процессы перехода. От уровня к уровню. Как вверх, так и вниз.
Меня, например, занимает вопрос: вот римейк «Сердец четырёх» на современном материале (за неимением своего «креатива» нынешний кинобизнес обожает переделки советских шедевров; или хотя бы р а с к р а ш и в а т ь :) ) - там главная героиня была бы автором какой книжки? Про фитнес, наверное? То есть динамика наша сегодняшняя - она куда? По направлению К Ньясаленду или От? С точки зрения ОЧЕНЬ БОЛЬШИХ ДАННЫХ …


Tags: Не бывает мелочей
Subscribe

Posts from This Journal “Не бывает мелочей” Tag

  • В двух словах

    эмигранты волнуются Самый интересный вопрос возникнет потом. Куда ре-эмигрировать д а л ь ш е будут? Ну, когда волноваться перестанут :) .

  • Блюститель :)

    Соловьев, на всякий случай, принял ислам??? Вот вопрос у меня есть, на  который, как атеист, я внимания как-то не обращал... А теперь обратил.…

  • Об интеграции. Глубокой. И где-то даже многовекторности …

    Жена ведущего Всероссийской государственной телерадиокомпании (ВГТРК) Сергея Брилева Ирина получила гражданство Великобритании. Соответствующие…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments