waspono (waspono) wrote,
waspono
waspono

Categories:

Куда кривая вывезла

.



Г. С. Мурашева
доцент М. Г.У
КРИВАЯ ОШИБОК
И
ПОНЯТИЕ СЛУЧАЙНОСТЕЙ



Это мой любимый советский фильм «Сердца четырёх». По фильму это название книжки, написанной старшей из сестёр.


Монтаж картины был завершён буквально накануне начала Великой Отечественной войны. Выход столь «легкомысленной» ленты, в которой командир Красной армии был водевильным персонажем, в тяжелейшее для страны время сочли неуместным, и картину выпустили в прокат лишь 5 января 1945 года, когда разгром нацистов был уже лишь делом времени.
https://ru.wikipedia.org/wiki/Сердца_четырёх


А у «легкомыслия» оказался неожиданный поворот :) .


ROC-кривая (англ. receiver operating characteristic, рабочая характеристика приёмника) — график, позволяющий оценить качество бинарной классификации, отображает соотношение между долей объектов от общего количества носителей признака, верно классифицированных как несущих признак, (англ. true positive rate, TPR, называемой чувствительностью алгоритма классификации) и долей объектов от общего количества объектов, не несущих признака, ошибочно классифицированных как несущих признак (англ. false positive rate, FPR, величина 1-FPR называется специфичностью алгоритма классификации) при варьировании порога решающего правила.
[…]
Задача классификации состоит в том, чтобы относить ранее неизвестные сущности к тому или иному классу. Примером такой задачи может быть постановка диагноза по медицинским анализам. В этом случае есть два класса результатов: положительный (positive) и отрицательный (negative). Тогда на выходе классификатора может наблюдаться четыре различных ситуации:
* Если результат классификации положительный, и истинное значение тоже положительное, то речь идет об истинно-положительном значении (true-positive, TP)
* Если результат классификации положительный, но истинное значение отрицательное, то речь идет о ложно-положительном значении (false-positive, FP)
* Если результат классификации отрицательный, и истинное значение тоже отрицательное, то речь идет об истинно-отрицательном значении (true-negative, TN)
* Если результат классификации отрицательный, но истинное значение положительно, то речь идет о ложно-отрицательном значении (false-negative, FN)
* […]
ROC-кривые впервые использованы в теории обработки сигналов в США во время Второй мировой войны для повышения качества распознавания объектов противника по радиолокационному сигналу[1]. После атаки на Перл Харбор в 1941 году, американские военные начали новые исследования, направленные на попытки увеличения точности опознавания японских самолетов по радиолокационным сигналам.
https://ru.wikipedia.org/wiki/ROC-кривая


Наряду с FPR и TPR используют также показатели чувствительности и специфичности, которые также изменяются в интервале

:
* чувствительность алгоритма

* совпадает с

* ;
* специфичность алгоритма

* определяется как

* .
Модель с высокой чувствительностью часто дает истинный результат при наличии положительного исхода (обнаруживает положительные примеры). Наоборот, модель с высокой специфичностью чаще дает истинный результат при наличии отрицательного исхода (обнаруживает отрицательные примеры). Если рассуждать в терминах медицинской диагностики, где модель классификации пациентов на больных и здоровых называется диагностическим тестом, то получится следующее:
* чувствительный диагностический тест проявляется в гипердиагностике – максимальном предотвращении пропуска больных;
* специфичный диагностический тест диагностирует только доподлинно больных. Это важно в случае, когда, например, лечение больного связано с серьезными побочными эффектами и гипердиагностика пациентов нежелательна.
http://www.machinelearning.ru/wiki/index.php?title=ROC-кривая


Чертовщинка какая-то, да :) ?

Или … Big Data :).
Только ОЧЕНЬ БОЛЬШИЕ Data.
Что-то такое (сверх понимания человека) носилось в воздухе … Прорывалось … Даже в водевильчике. (Где-то ведь взято было столь причудливое название для книжки! Была область математики/, интересовавшаяся Темой. И здесь, и там. Вот в оперетте «Летучая мышь» представить такую книжку как-то сложнее *.). Разумеется, понято не было. Да и не могло быть понято. Но след - остался …

*
Не только там. Неявно предполагается наличие определённого достигнутого уровня знаний. В определённого же уровня развития странах. Появление Годдарда (США), Циолковского (Россия) и Оберта (Германия) было практически синхронным. В Северо-Западной Пограничной провинции или Ньясаленде ничего подобного (тогда) возникнуть не могло. Никогда! Уровень не тот.
Поскольку уровень этот - величина динамическая (раз достигнутое может быть утеряно (спутники стали падать чаще прежнего), а недостижимое вдруг стало достигаться), самое интересное - это процессы перехода. От уровня к уровню. Как вверх, так и вниз.
Меня, например, занимает вопрос: вот римейк «Сердец четырёх» на современном материале (за неимением своего «креатива» нынешний кинобизнес обожает переделки советских шедевров; или хотя бы р а с к р а ш и в а т ь :) ) - там главная героиня была бы автором какой книжки? Про фитнес, наверное? То есть динамика наша сегодняшняя - она куда? По направлению К Ньясаленду или От? С точки зрения ОЧЕНЬ БОЛЬШИХ ДАННЫХ …


Tags: Не бывает мелочей
Subscribe

Posts from This Journal “Не бывает мелочей” Tag

  • Ещё раз к теме «дежурных по стране»

    У д и в и т е л ь н о смелое выступление! (Если слушать внимательно :) )

  • Небольшой upd к ранее написанному

    Аятоллы снова (пусть и с огромной потерей темпа) вернулись таки к ракетно-ядерной программе. С вполне предсказуемым радиусом поражения. И в этом…

  • «fly-by-wire»-2

    Вот ничего т а к о г о не ожидал … … всего-то хотел прогноз погоды послушать. Для Ближнего Подмосковья :) . А нарвался на прогноз ……

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments