Дерево решений

2 лучших брокера бинарных опционов за 2020 год:
  • Бинариум
    Бинариум

    1 место! Самый старый и надежный брокер бинарных опционов. Бонусы за открытие счета! Лучший вариант для начинающих трейдеров.

  • ФинМакс
    ФинМакс

    У этого брокера больше всего торговых инструментов. Подходит для опытных трейдеров.

Количественные методы анализа для решения проблем бизнеса

Курс «Количественный анализ» (КА), возможно, является наиболее сложным и важным в программе МВА. Он знакомит с основными инструментами, используемыми преимущественно в сферах финансов, бухгалтерского учета, маркетинга и управления операциями. Поэтому данную главу не следует пропускать только по той причине, что вы не привыкли иметь дело с цифрами и статистикой. Уделите ей внимание!

Знание количественных методов анализа отличает МВА от коллег, не учившихся по программе МВА. МВА может произвести неизгладимое впечатление на босса своими мудреными схемами, диаграммами и выразительным языком. Хорошо, когда и выводы МВА встречают такой же теплый прием.

Применение количественных методов анализа для решения деловых проблем — главное дело МВА. Эти методы помогают МВА сохранять объективность при работе над сложными задачами. Теории, лежащие в основе КА, не так уж стройны, но это не важно: их можно использовать для решения проблем бизнеса. И все же следует заметить, что, как бы точны ни были математические инструменты КА, они никогда не заменят продуманного суждения МВА.

Рисунок 1. «Я очень надеюсь, Фернбо, что ваша статистика не имеет никакого смысла»

Теория принятия решений

Теория принятия решений учит расчленять сложные проблемы на отдельные фрагменты. Если не разобрать трудную ситуацию на такие «удобоваримые» элементы, она быстро становится неуправляемой. КА может использовать и «дикий» нефтеразведчик, прикидывая, стоит ли бурить в данном месте скважину, однако анализ не спасет его от рисков, сопряженных с разведывательным бурением. Схема дерева решенийпозволяет соотнести альтернативы, риски и вероятность того или иного исхода.

Анализ методом дерева решений проводится в пять этапов:

  1. Определение всех возможных альтернативи рисков, связанных с ситуацией.
  2. Расчет в денежномвыражении последствийкаждой из альтернатив.
  3. Оценка неопределенности, связанной с каждой альтернативой.
  4. Изображение первых трех действий в виде дерева.
  5. Определение наилучшей альтернативыи учет неденежных аспектов проблемы.

В точках, где возможен выбор альтернатив, на дереве решения изображают разветвление действийили разветвление событий. Например, процесс принятия решения «бурить или не бурить» можно представить на дереве решений разветвлением. Точка выбора обозначается на дереве решений квадратом. Если имеющиеся альтернативы характеризуются неопределенностью, изображается разветвление событий. Неопределенный исход разведывательного бурения относится к категории событий, и соответствующая точка обозначается на дереве решений кружком.

Рисунок 2.

Пример дерева решений

Для примера рассмотрим ситуацию мистера Сэма Хьюстона из Техаса — тут может пригодиться дерево решений. Мистер Хьюстон подумывает приступить к бурению на перспективном участке. Следует ли ему бурить? Если из скважины забьет нефтяной фонтан, он разбогатеет примерно на $1 000 000. Проанализировав все альтернативы, мистер Хьюстон составил следующий список:

  1. Сэм заплатил $20 000 за право бурить.
  2. Сэм может снизить свои риски, наняв геолога для выполнения сейсморазведки ($50 000). Благодаря этому он точнее выяснит вероятность успеха и снизит риск напрасной траты денег на бурение.
  3. А может быть, просто положиться на судьбу и израсходовать $200 000 на бурение без предварительной сейсморазведки?
  4. Сэм посоветовался с экспертами. Они считают, что на участке Сэма вероятность попасть в нефтеносный пласт без всякой разведки равна 60%.
  5. По опыту экспертов, в случае позитивных результатов сейсморазведки вероятность наткнуться хоть на толику нефти равна 90%. Следовательно, ве-роятность неудачи всего 10%.
  6. Если сейсморазведка даст негативный результат, Сэм все равно может бурить, но с вероятностью успеха 10% и неуспеха — 90%.
  7. Сэм может в этом случае вообще отказаться от бурения.

Каждый элемент информации отражается на дереве решений. Дерево решений помогает мистеру Хьюстону организовать в графической форме имеющиеся альтернативы.

Рейтинг лучших брокеров БО на русском языке:
  • Бинариум
    Бинариум

    1 место! Самый старый и надежный брокер бинарных опционов. Бонусы за открытие счета! Лучший вариант для начинающих трейдеров.

  • ФинМакс
    ФинМакс

    У этого брокера больше всего торговых инструментов. Подходит для опытных трейдеров.

Прежде чем рьяно рисовать дерево, следует выявить нерелевантную информацию. В нашем случае это информация о невозвратных расходах, то есть о $20 000, истраченных на получение лицензии. Эти деньги уже все равно что выброшены, вернуть их невозможно, какое бы решение Сэм ни принял. Поэтому невозвратные расходы на дереве решений не изображаются.

Рисуем древо решений

Приступая к рисованию дерева решений, начать следует с первого необходимого решения (разветвления). Нужно ли Сэму начинать с сейсморазведки? Если да, то это действие должно предварять все последующие. На дереве решений появляется квадрат, обозначающий первый узел с ветвями возможных действий.

Рисунок 3.

Если Сэм выполняет сейсморазведку, результатом может быть позитивное (с вероятностью 60%) или негативное (с вероятностью 40%) событие. Отказавшись от сейсморазведки, он все равно должен будет выбрать бурить или не бурить (квадрат). И после любого результата сейсморазведки выбор, бурить или нет, остается в его руках. Но как только заработает буровая установка, появление или отсутствие нефти в скважине становится неконтролируемым событием. Сулящий миллион долларов фонтан либо брызнет, либо нет.

Следующий шаг — добавление последствий в денежном выражении в виде «листьев на дереве». Если нефть есть, это принесет $1 млн. Расходы на бурение равны $200 000 на скважину. Сейсморазведка обойдется в $50 000 на скважину.

Рисунок 4.

Для определения потенциальных финансовых последствий каждого решения нужно умножить денежный эквивалент каждого возможного исхода на его вероятность, обозначенную на соответствующей ветви (там, где стоят кружки). ([Прибыль $1 млн x вероятность 0,9] + [Прибыль $0 x вероятность 0,1] = $900 000.) Этот расчет дает вам ожидаемую денежную ценностьсобытия, хотя фактические исходы могут располагаться по всему спектру значений. В каждом кружке сумма вероятностей должна равняться 100% (0,9 + 0,1 = 1,0); это означает, что учтены все вероятные события. Ветви, исходящие из каждого узла, изображают взаимоисключающие альтернативы, суммарная вероятность которых равна 100%, то есть является исчерпывающей.

В узлах с ветвями возможных действий (квадраты)тот, кто принимает решение, может выбирать наилучший исход. Для определения наилучшей альтернативы вычтите затраты из выигрыша по каждой из имеющихся альтернатив. При расчете последствий решения следует двигаться из крайней правой точки налево. Вы как бы «складываете» дерево или «обрезаете ветви», чтобы получить решение по наилучшему для вас плану действий. В узлах-квадратах следует выбирать ветви с наивысшим выигрышем, в узлах-кружках — умножать возможные выигрыши на соответствующие вероятности.

Дерево решений рекомендует отбросить всякую осторожность и исключить сейсморазведку. Ожидаемая денежная ценность для варианта бурения с предшествующей сейсморазведкой равна $370 000 (420 – 50), а без сейсморазведки — $400 000. Вы выбираете максимум ожидаемой денежной ценности (ОДС). Этот сравнительно простой метод можно применять для принятия решений в ситуациях разработки нового продукта, хозяйственного освоения недвижимости и выбора уровней запасов на складе. В любой подобной ситуации дерево решений вынуждает того, кто берется решать, подробно рассмотреть все альтернативы, оценить уровень неопределенности (вам ведь приходится делать вероятностные предположения) и рассчитать денежные эквиваленты возможных исходов. Дерево решений заставляет точно формулировать допущения. Например, вы допускаете определенную вероятность получения нефти после отрицательного результата разведочного бурения. Другой человек, анализирующий ту же ситуацию, может прийти к иному выводу. Сравнивая деревья, аналитики могут упорядоченным образом обсуждать конкретные допущения.

Рисунок 5. Дерево решений применительно к ситуации бурения

«Нарисовать дерево решений и выбрать вариант В» — примерно так звучали ответы на экзамене по применению метода дерева решений. Это дерево помогает разглядеть сложность простой с виду проблемы. Даже точное изображение дерева решений оказалось серьезным испытанием во время четырехчасового экзамена: выполнить его грамотно мог только тот, кто много практиковался.

Рисунок 6. Дерево решений применительно к ситуации бурения (в тыс. долл.)

Анализ движения денежных средств

Термин «движение денежных средств» часто упоминается в сочетании с понятием «покупка с использованием заемных средств». Это — основа финансового анализа. Специалисты с Уолл-стрит могут быстро прикинуть каче-ственный аспект инвестиционных решений, но в конечном счете для них имеют значение только последствия в денежном выражении. Анализ движения денежных средств основывается на той же информации, которую использует бухгалтер для подготовки отчета о движении денежных средств. Этот анализ отвечает на простой вопрос: Какова стоимость вложенного капитала и сколько денежных средств он сможет генерировать ежегодно?

Денежные средства, генерируемые компанией, можно использовать для погашения задолженности, выплаты дивидендов, инвестирования в исследования, покупки нового оборудования или освоения недвижимости. Цель анализа — установить, когда, в каком объеме и в каком направлении потекут денежные средства при развитии событий по конкретному сценарию.

Инвестор может иметь в виду несколько целей, однако анализ движения денежных средств имеет отношение только к деньгам. К примеру, рекламная деятельность компании может повысить репутацию фирмы, но если выгоды от этого невозможно представить в денежном выражении, то анализ движения денежных средств здесь неуместен.

Анализ движения денежных средств нужен при покупке как станка, так и компании. Поэтому давайте переформулируем наш первый вопрос:

Каковы нынешние инвестиции и каковы будущие выгоды? Чтобы ответить на этот вопрос, необходимо:

  1. Определить объем инвестиций.
  2. Рассчитать величину выгод.
  3. Составить календарь получения выгод.
  4. Уточнить вероятность получения выгод.
  5. Решить, оправдают ли выгоды ожидание.

Тут скрывается одна проблема: анализ движения денежных средств отражает потоки средств, но не прибылей. Например, перспективная компьютерная компания-стартап в Кремниевой долине «по бумагам» рассчитывает на прибыль в размере $3 млн, но если необходимо вложить $20 млн в исследования и $30 млн в строительство завода, то пока компания лишь тратит деньги. Ее прибыльность отнесена в будущее.

Расчетная прибыль, указываемая в отчете о прибылях и убытках, позволяет замерить инвестиции на отрезке времени, меньшем, чем окупаемость инвестиций, в то время как анализ движения денежных средств дает оценку конкретного проекта на весь срок проекта.

Для оценки первоначального движения средств по проекту может понадобиться следующая информация:

  • Использование денежных средств:
    • затраты на строительство;
    • приобретение запасов;
    • покупка оборудования;
    • рост дебиторской задолженности (клиенты покупают в кредит, заимствуя у вас средства на покупку).
  • Источники денежных средств:
    • продажа лишнего оборудования;
    • рост кредиторской задолженности (вы приобретаете материалы в кредит, заимствуя у поставщиков денежные средства на покупку).

Определяем использование денежных средств внутри срока проекта:

  • Источники денежных средств:
    • доходы или продажи;
    • роялти.
  • Использование денежных средств:
    • затраты на реализованную продукцию;
    • затраты на сбыт;
    • общие и административные расходы;
    • налоги.

Амортизация, фигурирующая в отчете о прибылях и убытках, не имеет отношения к анализу движения наличных средств. Амортизация — это бухгалтерская условность: если срок службы какого-либо оборудования составляет пять лет, то ежегодно на протяжении пяти лет из дохода вычитается 1/5 стоимости этого оборудования. Напротив, с точки зрения анализа движения средств, деньги на приобретение машины потрачены сегодня, поэтому использование денежных средств указывается на дату приобретения машины. Затраты на амортизацию для этого отчета важны лишь тогда, когда они позволяют уменьшать «расчетную прибыль» и тем самым сократить затраты на уплату налогов. Так, магазин Bob’s Market в главе, посвященной бухгалтерскому учету, распределяет затраты на приобретение кассовых аппаратов и тележек на десятилетний период, хотя все это оборудование было полностью оплачено к открытию магазина.

И еще одна особенность: в анализе движения денежных средств не учитываются затраты на финансирование. Инвестиционное решение отделено от финансового. В компании General Electric реализуются тысячи проектов, используется множество форм финансирования: займы (облигации, банковские ссуды) и выпуск акций. Соотнести задолженность с индивидуальными проектами было бы невозможно. На самом деле финансовый отдел занимает деньги для удовлетворения всех текущих потребностей компании, а бюджетный отдел принимает решение, какие проекты стоит поддержать. Если бы решения этих двух отделов были увязаны, то проекты, финансируемые из заемных средств, в отчетах выглядели бы гораздо лучше тех, которые оплачиваются наличными, хотя по существу они ничем не отличаются.

Пример анализа движения денежных средств

Компания Quaker Oats планирует приобрести за $100 000 дробильную машину для своего предприятия в Канзас-Сити. Всеобщее увлечение растительными волокнами резко повысило спрос на толокно, и завод уже не справляется. Купив машину, компания сможет производить каш еще на $80 000 в год. Затраты на реализованную продукцию составляют всего $20 000, прибыль облагается тридцатипроцентным налогом. Увеличение объема продаж предполагает также увеличение складских запасов на сумму $10 000. Эти затраты компания отчасти покроет, увеличив на $8000 кредиторскую задолженность фермерам за овес и компании Stone Container за упаковки, так что всего придется потратить $2000.

Машина проработает с полной нагрузкой три года, а потом она еще сможет послужить мукомольной компании в Мексике. Quaker Oats перепродаст оборудование мексиканской Molino Grande за $10 000.

Рисунок 7.

В данном примере для оценки проекта критически важно распределение потоков денежных средств во времени. Обычно это распределение представляют с помощью столбиковой диаграммы. Результат движения денежных средств за каждый период изображается либо под линией (вложение денежных средств), либо над линией (доходы). В примере с компанией Quaker Oats столбиковая диаграмма имеет следующий вид:

Рисунок 8.

При тех же денежных потоках, но другом расписании диаграмма изменяется:

Рисунок 9.

А если получение доходов откладывается, то диаграмма выглядит так:

Рисунок 10.

Эти схемы показывают «стоимость» времени.

Накопленная стоимость

Как только проект производства толокна начнет приносить деньги, Quaker едва ли оставит их праздно лежать — деньги используются для реинвестиций. Значит, если компания получит, как предусмотрено сценарием А, по $51 000 в первые два года и $61 000 в третий, это позволит ей начать зарабатывать на реинвестициях на два года раньше, чем по сценарию В.

Если реинвестиции сулят 10% годовых, сценарий А принесет на $34 230 больше, чем сценарий В. Накопленная стоимостьденежных потоков по истечении трех лет составит $163 000 плюс дополнительный доход $34 230, что в совокупности даст $197 230. Сценарий А, несомненно, выгоднее.

Для упрощения расчетов используется формула накопленной или будущей стоимости доллара:

Будущая стоимость доллара после x периодов = (Текущая стоимость доллара) x (1 + Ставка реинвестирования) Число периодов

При ставке 10% коэффициент для года 1 = 1 x (1 + 0,1) 1 = 1,10.

Нет нужды запоминать коэффициенты или каждый раз их рассчитывать — можно использовать таблицы из Приложения или бизнес-калькулятор.

Согласно таблицам из Приложения, коэффициенты накопленной стоимостив зависимости от ставки процента и числа периодов для ставки в 10% составляют:

Рисунок 11.

Применяя эти коэффициенты в сценарии А к сумме $163 000, полученной в конце первого года и инвестированной на двухлетний период до конца третьего года, получаем следующую накопленную стоимость:

$163 000 на конец года 1 x 1,210 = $197 230 через 2 года или
$197 230 – $163 000 = $34 230 в форме дохода от реинвестиций.

Рисунок 12. Вычисление накопленной стоимости

При оценке проекта или инвестиций, ориентированных на будущее, важна не только величина денежных потоков, но и распределение потоков во времени и возможность использовать их для реинвестиций.

Чистая приведенная стоимость (NPV)

Анализ приведенной стоимости (NPV) помогает посчитать, сколько работнику нужно вложить, чтобы через 30 лет получать достойную пенсию, но этот анализ бесполезен при оценке текущих инвестиций и проектов. Инвестиции необходимо оценивать в сегодняшних параметрах. Во что сегодня обойдется проект Quaker Oats? Не лучше ли купить подобное оборудование за $150 000, но с четырехлетним сроком службы?

Анализ движения средств выявляет денежные потоки, а анализ накопленной стоимости оценивает эти потоки в сегодняшних долларах. Таким способом можно сравнивать разные проекты независимо от распределения денежных потоков во времени. Например, если компании Apple Computer известно, что новый компьютер Tangerine станет «хитом продаж» и принесет $5 млрд, но на его разработку потребуется 10 лет, компания, возможно, отвергнет этот проект.

Во-первых, за 10 лет инфляция отчасти обесценит эти $5 млрд, а главное, лучше вложить средства в робототехнику и сразу же снизить затраты на производство. Даже если анализ NPV оправдывает проект Tangerine, могут найтись более существенные стратегические соображения. Тут-то MBA и должен продемонстрировать способность принимать управленческие решения.

Специалисты по ценным бумагам приравнивают акции и облигации к покупке оборудования. Акции обеспечивают выплату дивидендов, а облигации — получение процентов в будущем. Стоимость ценных бумаг определяется как текущая стоимостьбудущего притока денежных средств. Как Quaker Oats, анализируя текущую стоимость, определяет выгоды от покупки нового производственного оборудования, так корпорации оценивают новые заводы или интенсивную рекламу. Юрист, берущийся представлять родственников жертвы, может с помощью анализа текущей стоимости прикинуть вероятные будущие доходы погибшего и подсчитать сумму компенсации. Главное, что необходимо запомнить: доллар сегодня стоит больше, чем доллар в будущем.

Проект Quaker Oats принес за три года $163 000 (51 + 51 + 61). Как мы подсчитали, эти $163 000 дадут дополнительные $34 230, если их реинвестировать под 10% годовых в другие проекты компании или вложить под проценты. Вы бы стали вкладывать $163 000 в надежде получить через три года те же самые $163 000? Разумеется, нет, ведь вы бы потеряли выраженную в деньгах стоимость денег, в данном случае — $34 000.

Исходя из этой простой логики, анализ NPV сводит будущие потоки денежных средств к их сегодняшней стоимости, то есть производит операцию, обратную вычислению накопленной стоимости. Расчетная формула выглядит так:

NPV = (Будущая стоимость доллара) x (1 + Ставка дисконта) Число периодов

$1, полученный через год, при ставке дисконта 10% будет стоить:

$1 x (1 + 0,1) –1 = 0,90909

С помощью этой формулы составлены таблицы коэффициентов дисконтированиядля разных ставок и периодов. С учетом возможности реинвестирования под 10% годовых и рисков проекта стоимость $1 в будущем в соответствии с формулой и таблицами составит:

Потоки денежных средств по проекту Quaker Oats оцениваются следующим образом:

Оценка любого проекта зависит от величиныпотоков денежных средств, распределения их во времении ставки дисконта — в нашем случае это 10%. Ставка дисконта — весьма субъективный критерий. Чем выше ставка дисконта или пороговая рентабельность, тем ниже стоит сегодня «будущий доллар». Пороговой эта норма называется потому, что чем выше ставка дисконта, тем больший приток денежных средств в будущем должен обеспечивать проект, чтобы иметь такую же ценность сегодня. То есть проекту необходимо преодолеть более высокий порог, чтобы свести концы с концами. Для рискованных инвестиций, вроде нашего примера с нефтяными скважинами, уместна более высокая ставка дисконта. Для надежного инвестирования, как при вложении средств в трудосберегающее устройство или гособлигации, приемлема невысокая ставка дисконта. Если в руководстве компании не найдется эксперта со степенью MBА, компания, не беря в учет относительную рискованность проектов, будет устанавливать для всех единую пороговую рентабельность. В итоге компания откажется от надежного вложения и ухватится за рискованный проект. Ни при каких обстоятельствах пороговая норма прибыли не должна равняться проценту на банковский кредит компании, разве что эти цифры случайно совпадут.

Ставка дисконта должна определяться рискованностью проекта. Стабильная компания может заимствовать денежные средства под очень низкий процент и инвестировать эти деньги в рискованные проекты.

Внутренняя рентабельность

Внутренняя норма рентабельности (IRR) — это производная NPV. IRR инвестиции — ставка, при которой сумма дисконтированных будущих притоков денежных средств равна стоимости инвестиционного капитала сегодня.

Для определения IRR необходимо последовательно проверять разные ставки дисконта, пока NPV не выйдет в ноль. По проекту Quaker Oats IRR составляет 26,709%. Проверим это число расчетами:

Для оценки проектов внутренняя норма прибыли важна, однако при этом не учитываются масштабы вложений. Небольшая инвестиция с непропорционально высокой прибылью ранжируется по такой системе выше, чем крупные инвестиции с адекватной прибылью. Выделив миллиард долларов на исследования, General Electric должна затем вложить большие суммы в крупные проекты со сравнительно низкой нормой прибыли.

При ранжировании по внутренней норме прибыли остаются без внимания IRR и коэффициенты дисконтирования, используемые при анализе NPV. Как я уже говорил, пороговые нормы прибыли корректируются с учетом уровня риска. При прочих равных вложения компании Quaker Oats в оборудование могут иметь относительно менее высокую IRR, чем весьма рискованные инвестиции шведской компании Merck в поиски лекарства от рака, однако NPV у Quaker Oats может оказаться выше. Небольшие потоки денежных средств, связанные с приобретением оборудования, дисконтируются по ставке 10% в связи с низким риском. В результате NPV окажется выше. Вложения в исследования рака следует оценивать по высокой ставке дисконта — 50%. Запомните: чем выше ставка дисконта, тем ниже стоимость наличных средств сегодня и тем выше уровень предполагаемого риска.

Теория вероятности

Теория вероятности — красивое название статистики, предмета, которого побаиваются даже наиболее талантливые слушатели бизнес-школ. По существу, теория вероятности — более точный термин, поскольку он объясняет, как статистика используется для решения задач. При определенной вероятностиобнаружения нефти как следует поступить Сэму? Сколько из 800 состоящих в браке слушателей лучших рейтинговых школ на первом году программы MBA позабудут о своих супругах? Все это теория вероятности. Почти все деловые люди избегают статистики, тут-то МВА и предоставляется возможность блеснуть. Я прослушал курс статистики еще в студенчестве и практически ничему не научился, так как нам преподавали теорию, а не решение проблем. Программы для МВА сосредоточены на практическом применении статистики, а теорию оставляют математикам. Если вы незнакомы со статистикой, ни в коем случае не пропускайте этот раздел. Нескольких страниц не хватит, чтобы сделать вас знатоком статистики, но если вы наберетесь терпения и прочтете эту главу, то будете разбираться в этом сложном вопросе достаточно, чтобы вовремя попросить о помощи. В том-то и суть подготовки MBA — дать слушателям практические знания по различным предметам. Преподаватели не надеются за два года превратить учеников в экспертов, но требуют, чтобы выпускники понимали, когда им требуется помощь эксперта для решения конкретной проблемы.

Распределение вероятностей

В ситуациях с множественными возможными исходами подсчитывается их распределение. Каждому исходу приписывается определенная вероятность. С помощью тщательного анализа и интуиции вычисляются все возможные исходы того или иного события. Сумма вероятностей всех исходов равна 100%, как и на любом разветвлении дерева решений. График распределения исходов называется вероятностной мерой или плотностью вероятности. Когда вероятных исходов много, кривая получается плавной и в этом случае называется функцией плотности вероятности. Если возможных исходов всего несколько, кривая неровная, и в этом случае она называется вероятностной мерой.

Пример с дождями. Дождь в Сиэтле — событие, характеризуемое определенным распределением вероятностей. В соответствии с гипотетическими данными выпадение дождей в Сиэтле можно представить в форме таблицы и графиков распределения вероятностей (табл. 1).

Таблица 1.

Рисунок 13. Вероятностная мера осадков. Дневные осадки в Сиэтле за март 2020 г. (31 день)

Биномиальное распределение

Подбрасывание монеты имеет два вероятных исхода — монета падает орлом или решкой кверху. Поэтому распределениеисходов двух подбрасываний монеты дает несколько разных результатов с точки зрения того, кто поставил на орла.

Двойная удача — орел/орел.
Одна удача / одна неудача — орел/решка.
Двойная неудача — решка/решка.

Подбрасывание монеты описывается самым простым видом распределения вероятностей — биномиальным. При биномиальном распределении существует всего два одинаково вероятных исхода — удача и неудача.

«Тайную теорию» биномиального распределения можно применить к такому практическому делу, как анализ рынка акций. Удачей на рынке можно считать прибыль по итогам месяца, а неудачей — убыток или нулевую прибыль. В исследовании динамики цен на акции компании AT&T за период с 1957 по 1977 г. был проанализирован каждый месяц и установлена пропорция удачных месяцев: в 56,7% случаев за двадцатилетний период успех был обеспечен.

Исследованные месяцы были объединены в группы по три (кварталы). Исследователи выявили частоту событий с благоприятным исходом (рис. 14)

Рисунок 14.

Математик, подбрасывавший монету, составил таблицы для решения всех задач по биномиальному распределению. В случае с компанией AT&T для пользования такой таблицей необходимо иметь следующую информацию:

r= число благоприятных исходов = от 0 до 3;
n= число попыток = 3 (3 месяца в квартале);
р= вероятность благоприятного исхода = 56,7%.

На основании этой информации таблица биномиального распределения предсказывает ожидаемые исходы (рис. 15):

Рисунок 15.

Как ни странно, биномиальное распределение довольно хорошо коррелирует с фактическими результатами по AT&T. При даннойвероятности благоприятного исхода(p) вероятность получения прибыли по итогам месяца за конкретный квартал можно узнать из таблицы. Поэтому инвестиционные менеджеры, директора по продажам и аналитики могут делать из биномиального распределения практические выводы.

Нормальное распределение: тайна колоколообразной кривой

Нормальное распределениевстречается чаще всего, а его графическое представление обычно называют колоколообразной кривой. В Гарварде при выставлении оценок используют колоколообразную кривую. Кривая показывает, что 15% слушателей получают низкую оценку (проходной балл). В Дарденской бизнес-школе преподаватели ставят неудовлетворительную оценку, основываясь на собственном суждении. Результат: в двух кампусах сложилась принципиально разная конкурентная среда.

Когда вероятностная мера выводится на основании множества проб, точки кривой сближаются, и она принимает колоколообразные очертания. Такую кривую мы называем функцией плотности вероятности. Именно так выглядели графики осадков в Сиэтле. Горб посреди кривой объясняется центральной предельной теоремой. Она гласит, что «распределение средних арифметическихдля повторяющихся независимых выборок принимает форму колоколообразного нормального распределения». Почему? Просто потому, что при большом числе независимых выборок итог стремится к центральному среднему арифметическому.

Концепция «средних по выборкам» довольно расплывчата. На практике речь идет о достаточно больших группах данных. Почему? Потому что нормальное распределение легко использовать, и оно всегда оказывается близко к реальности. Курс акций — это отражение многочисленных конъюнктурных колебаний на рынке, результатом которых будет благоприятный или неблагоприятный исход. Этот результат можно рассматривать в качестве «среднего арифметического» конъюнктурных колебаний. Едва ли не все происходящее можно рационализировать через среднее арифметическое, и этим объясняется полезность нормальных распределений.

Рисунок 16. Колоколообразная кривая оценок

Параметры нормальной кривой. Колоколообразная кривая характеризуется двумя параметрами: средними стандартным (среднеквадратичным) отклонением (СКО). Среднее (μ) является центром кривой. Обычно его называют средним арифметическим. Оно вычисляется делением суммы значений на их количество. Среднеквадратичное отклонение (σ) определяет ширину кривой. СКО можно также описать как критерий «отклонения от среднего». Две эти характеристики играют ключевую роль в большей части концепций теории вероятности.

Другие критерии средней величины для совокупности данных — медиана, величина, стоящая в середине упорядоченного по возрастанию списка данных, и мода — величина, чаще всего встречающаяся в выборке.

Как и в случае биномиального распределения, сумма всех исходов, представленная площадью под кривой, равна 100%. Особенность нормальной кривой заключается в том, что для любого среднеквадратичного отклонения от среднего или центра вероятность события одинакова, независимо от формы кривой.

Пример нормального распределения из розничной торговли. Эл Банди, владелец обувного магазина, хочет быть уверен, что на складе имеются запасы обуви любого размера. Он купил в Академии ног данные по частоте женских ног и получил результаты проведенного Академией опроса. На миллиметровке Банди расположил эти данные и получил нормальное распределение. Он также ввел данные в свой калькулятор и нажал кнопку «стандартное отклонение». Ответ был «2». Эл также проверил среднее арифметическое для всей совокупности ответов по размерам и получил ответ «7». Посмотрев на кривую, он увидел внушающее доверие нормальное распределение (рис. 17).

Рисунок 17. Плотность вероятности замеров осадков. Ежедневный уровень осадков в Сиэтле, 1970–2020 гг. (14 600 дней)

Как только Эл распознал кривую, он смог применить законы нормального распределения. Площадь участков под нормальной кривой всегда описывается формулой:

1 СКО = 0,3413
2 СКО = 0,4772
3 СКО = 0,49865
4 СКО = 0,4999683

Рисунок 18. Функция плотности вероятности — кривые для разных значений среднеквадратичного отклонения

Если мистер Банди, учтя эти данные, запасет размеры с 5-го по 9-й, он сможет удовлетворить потребности 68,26% (0,3413 x 2) покупательниц. Расширив ассортимент склада с 3-го по 11-й размеры, он сможет обуть 95,44% женщин. Если же Эл будет иметь на складе размеры с 1-го по 13-й, 99,73% клиентов уйдут от него с покупкой. Для тех, у кого размер меньше 1-го или больше 13-го, он может сделать специальный заказ.

Естественно, таблицы нормальных распределений составлены для определения вероятности любой конкретной точки на кривой (с учетом нецелочисленных СКО). Для пользования таблицами необходимо рассчитать значение Z.

Рисунок 19. Нормальное распределение для размеров обуви

Пример использования нормальной кривой в финансовой деятельности

Давайте применим новые правила теории вероятности к финансовой деятельности. Ежемесячная прибыль на колеблющиеся акции компании Pioneer Aviation представлена в виде кривой нормального распределения. Сводные данные по прибыли в ретроспективе показывают, что среднее равно 1%, а СКО (разброс) — 11%. Джеральд Расмуссен хочет узнать, какова вероятность получить в следующем месяце прибыль менее 13%.

Используя формулу расчета Z, мы можем составить формулу:

Таблица нормального распределения, которую я привожу в Приложении, говорит нам, что 1,09 СКО равно 0,3621. Площадь участка под всей левой половиной кривой равна 0,5000, так как она представляет половину распределения. Это верно в любой ситуации. Вероятность попадания в точку, находящуюся выше или ниже центра или среднего нормального распределения, равна 50%. Исходя из приведенных данных, определяем вероятность того, что прибыль на акции окажется ниже 13%: 0,3621 + 0,5000 = 0,8621, и, с другой стороны, — что она окажется выше 13%: 1 – 0,8621 = 0,1379. Это реальный ответ на реальную деловую задачу с использованием инструмента статистики.

Рисунок 20. Плотность вероятности. Ежемесячный доход по акциям Pioneer Aviation

Рисунок 21. Плотность вероятности. Ежемесячный доход по акциям Pioneer Aviation

Статистика не трудна, если не напирать чересчур на теорию. Существуют и другие распределения, но их редко используют в бизнесе. Распределение Пуассонасходно с нормальным распределением, но имеет удлиненный хвост в правой части графика. Однако в большинстве случаев распределениесчитается нормальным, так как это позволяет использовать правила стандартного отклонения.

Кумултивные функции распределения

Кумулятивная функция распределениядает интегральную картину распределения вероятности. Она рассматривает функцию вероятностной меры типа колоколообразной кривой и задает вопрос: «Какова вероятность того, что результат окажется меньше или равен такому-то?» Нормальная кривая показывает вероятность конкретного значения, a кумулятивная функция — вероятность данного спектра значений. Кумулятивная функция позволяет объединить понятие о неопределенности (теорию вероятности) с нашим инструментом для принятия решений (дерево решений). Она охватывает весь спектр возможных исходов при анализе переменных с множественными значениями.

Вернемся к примеру с нефтяной скважиной и посмотрим распределение значений возможной стоимости нефти (табл. 2):

Таблица 2.

При построении дерева решений мы исходили из возможного выигрыша в миллион. Такова была ожидаемая стоимость нефти — я выбрал эту сумму ради удобства. При распределении мы получаем широкий спектр значений. Как видно из таблицы, с вероятностью 0,005 прибыль может оказаться равной $6 млн и $50 000. Если все эти суммы умножить на соответствующие вероятности, указанные во втором столбце, а затем сложить произведения, получится тот самый $1 млн, ожидаемая стоимость.

Построив функцию кумулятивного распределения, человек, принимающий решение, устанавливает среднее, то есть ожидаемую стоимость, и с этого может начать анализ. Построение кумулятивного распределения позволяет объединить оценки вероятности верхней границы, середины и нижней границы спектра исходов и установить ожидаемую стоимость, что позволит принять решение.

В графической форме кумулятивное распределение исходов в диапазоне напоминает большую букву «S». На такой кривой сразу видны все возможные исходы, а не только разрозненные статичные точки. Как показано на следующем графике, Сэм Хьюстон считает, что все возможные в данном случае исходы попадают в непрерывный диапазон значений от 0 до $6 000 000. Диапазон вероятностей от 0 до 1,0 кумулятивного распределения разбивается на части — квантили — методом медиан интервального ряда. В таблице именно так разделена ожидаемая стоимость. Например, чтобы разделить диапазон вероятности ожидаемой стоимости на пять частей, нужно взять квантили 0,1; 0,3; 0,5; 0,7 и 0,9. Эти квантили будут представлять собой среднее арифметическое в диапазонах значений 0–0,2; 0,2–0,4; 0,4–0,6; 0,6–0,8 и 0,8–1,0 соответственно.

Квантиль 0,5 равнозначен медиане, поскольку с каждой его стороны находится ровно половина возможных значений. Медиана не обязательно совпадает со средним, то есть центром нормального распределения. Медиана — это просто центр диапазона значений. Среднее — это сумма произведений всех вероятностей на соответствующие значения: именно так мы получили ожидаемую стоимость обнаружения нефти $1 млн.

Чтобы объединить концепцию кумулятивного распределения с деревом решения и принимать существенные управленческие решения, нужно представить себе все вероятные значения прибыли от нефтяной скважины. Диапазонзначений можно изобразить в виде веерасобытий. Кому-то может не хватить терпения для представления бесконечных возможностей в виде ветвей дерева, и тут выручит кумулятивная вероятность.

Рисуем кумулятивное распределение. Чтобы представить кумулятивное распределение в графической форме, как показано ниже, следует опираться на собственное суждение и данные исследований. Нужно задать себе ряд вопросов:

  • При каком значении в 50% случаев результат оказывается выше или ниже заданного значения (медиана)?
  • Каким будет значение нижнего конца спектра (квантиль 0,10)?
  • Каким будет значение верхнего конца спектра (квантиль 0,90)?

Рисунок 22. Кумулятивная функция распределения возможных исходов бурения (в тыс. долл.)

Рисунок 23. Дерево решений для бурения на нефть с использованием функции кумулятивного распределения (в тыс. долл.)

Ответив на эти вопросы, вы сможете представить кумулятивную стоимость возможных исходов. Ограничившись пятью исходами или пятью квантилями кумулятивного распределения, вы можете изобразить веер событийи их вероятностей на дереве решений в виде пяти ветвей. Ожидаемый денежный эквивалент будет таким же, как при первом рассмотрении, но только потому, что с самого начала для удобства была задана правильная величина ожидаемой стоимости.

Сокращенный вариант такого анализа называют методом Тьюки–Пирсона. Вместо пяти квантилей используется всего три — 0,05; 0,5 и 0,95. Соответствующие этим квантилям вероятности — 0,185; 0,63 и 0,185.

Применительно к крупным задачам дерево решений строится с помощью компьютерных симулякров Монте-Карло, самый популярный из них — Oracle. Дерево и параметры «веера событий» кумулятивного распределения включены в компьютерную модель. Программа прогоняет множество сценариев событий, чтобы дать вам представление, чем может обернуться дело. Некоторые из компаний Fortune 500 используют этот метод.

Кумулятивное распределение и анализ методом квантилей можно применять к ситуациям, в которых ожидаемая стоимость ветви дерева решений неопределенна. Однако важнее всего суждение аналитика. Дерево — это всего лишь инструмент, который МВА обязан использовать в сочетании со своими знаниями и интуицией.

Регрессионный анализ и прогнозирование

Модели линейной регрессииприменяются в самых разных деловых ситуациях для установления зависимости между переменными, которые, как подсказывает аналитику его интуиция, должны быть между собой связаны. После того как зависимость установлена, ее можно использовать для прогнозирования. Обычно регрессионный анализ используется для соотнесения продаж с ценой, рекламой и рыночными факторами; курса акций с доходами и процентными ставками; затрат на производство с объемами производства. Но, конечно, анализ можно использовать также и для ответов другие вопросы: «Как влияет температура воздуха на продажу мороженого?» Независимой переменной в этом случае является температура. Это та переменная, от которой, как предполагается, зависит все остальное. Зависимой переменнойбудет объем продаж. Температура на улице влияет на объем продаж, но не наоборот.

Для регрессионного анализа необходимо собрать данные, чтобы установить отношения между переменными. Когда данных много, как в случае информации по изменениям температуры и объема продаж за год, можно построить график, откладывая по оси X значения температуры, а по оси Y — объемы продаж. Цель регрессионного анализа — составить уравнение прямой, которая «наилучшим образом» отображает зависимость, то есть провести линию между нанесенными на график точками так, чтобы «значение суммы квадратов отклонений точек от линии было наименьшим». При работе методом наименьших квадратовприходится бесконечно складывать, вычитать и умножать. Для облегчения расчетов нужны калькулятор или программа построения электронных таблиц.

Краткое повторение курса алгебры

Перед рассмотрением примера регрессивного анализа вспомним основы алгебры. Как вы помните, прямая описывается следующей формулой:

Y — зависимая переменная (например, объем продаж);
m — угол наклона прямой (отношение между переменными);
X — независимая переменная (например, дождь);
b — ордината при Х = 0 (точка, в которой график пересекает вертикальную ось).

Программа построения электронных таблиц рассчитывает линейное уравнение (Y = mX + b), описывающее связь между независимой и зависимой переменными. Программа определяет, можно ли использовать прямую, «наилучшим образом» отображающую эту связь, в качестве точного инструмента прогнозирования.

Пример: Регрессонный анализ продаж мороженого

Владелец сети из двадцати магазинов по продаже мороженого Ben & Jerry’s заметил, что объемы продаж растут и снижаются вместе с ростом и понижением температуры воздуха. Решив определить точную математическую зависимость между объемом продаж и сезонными температурами, он собрал данные по ежемесячным объемам продаж за предыдущие пять лет, а в Национальной метеорологической службе получил данные по среднемесячным температурам. В результате получилась следующая таблица (3):

Таблица 3.

Используя функцию «Regression» программы построения электронных таблиц, владелец получил следующий результат (табл. 4):

Таблица 4.

Таблица 5.

Что это значит?

Поразительно: этот набор данных позволяет составить уравнение прямой, выражающей зависимость между температурой и объемами продаж в магазинах Ben & Jerry’s. Сначала объясним данные, на основе которых составляется линейное уравнение.

Ордината в точке пересечения оси Y = b= –379,066
Коэффициент Х = m= 16,431

Подставляя эти значения в стандартное линейное уравнение, которое мы припомнили из курса алгебры, получаем: Y = 16,431X – 379,066. Наносим точки на график и проводим линию регрессии, описанную этим уравнением. В результате получаем (рис. 24):

Рисунок 24. Регрессионный анализ (продажи мороженого в Ben & Jerry’s)

На графике видно, что линия регрессии проходит посредине между точками данных. Введя значение температуры X в уравнение, можно определить прогнозируемыйобъем продаж мороженого. В случае с Ben & Jerry’s при температуре 60 °F (15 °С) ожидаемый объем продаж за месяц должен составить $606 794.

Y = (16 431 x 60 °F) – 379 066 = $606 794

Однако насколько точно данное уравнение позволяет прогнозировать продажи мороженого? Чтобы ответить, нужно присмотреться к другому числу в таблице.

R-квадрат: разъяснение

Значение R-квадрат показывает, «какой процент разброса данных объясняется данным регрессионным уравнением». В нашем случае это 70,4% разброса данных по объему продаж — очень высокий показатель. В более масштабном экономическом анализе очень высоким будет считаться показатель 30%, так как на состояние экономики влияют тысячи переменных. Можно предположить, что в бизнесе, связанном с мороженым, на колебания объема продаж, помимо температуры, влияют также реклама, скидки, часы работы магазина.

Однако будьте бдительны! Не придавайте излишнего значения результатам регрессионного анализа! Они говорят нам только то, что объем продаж определенным образом изменяется при изменении температуры. Из этого анализа не следует, что «температура всегда влияет на объем продаж». Но если вы рационально и обоснованно выбрали независимую переменную и она хорошо предсказывает поведение зависимой переменной, значит, метод годится.

Регрессионный анализ выявляет не только позитивную, как в случае с температурой воздуха и объемом продаж мороженого, но и негативную корреляцию, например, процентных ставок и объема продаж жилья. Если процентные ставки слишком высоки, объем продаж низок и коэффициент X имеет отрицательное значение. С точки зрения прогнозирования подобные негативные зависимости так же полезны, как позитивные.

Погрешность оценки: разъяснение

«Среднеквадратичная погрешность оценки Y» и «среднеквадратичная погрешность коэффициента X» — синонимы стандартного отклонения ошибки коэффициента Y и коэффициента X графика регрессии. В примере с компанией Ben & Jerry’s среднеквадратичная погрешность оценки Y (объем продаж) составляет $243 334 в 68% случаев (табл. 5.4), а коэффициента X (температура) — 3367 (табл. 5.5). Можно провести ряд анализов, устанавливая диапазон этих данных и надежности с учетом среднеквадратичного отклонения, и проверить надежность полученного уравнения регрессии.

T–статистика как критерий надежности

T-статистика может подсказать, пригодно ли для прогнозирования уравнение регрессии, рассчитанное компьютерной программой: T-статистика проверяет, оказывает ли переменная X статистически значимое влияние на Y, как, например, температура воздуха — на объем продаж. Для опреде-ления данного критерия следует разделить коэффициент X на его среднеквадратичную погрешность. Если T-статистика окажется больше 2 или меньше –2, переменная X оказывает статистически значимое влияние на Y. В нашем примере критерий имеет очень высокое значение: 16431/3 367 = 4,88 (см. табл. 5.5). Поэтому аналитик делает вывод, что по температуре можно с высокой достоверностью прогнозировать объем продаж.

Модель прогнозирования подходит при высоких значениях и R, и T-статистики. Можно разработать модель более чем с одной переменной X. Мы будем иметь дело с многомерной регрессией. С ростом числа переменных увеличивается значение R. Однако прибавление числа переменных X при низком значении T-статистики приводит к неточной модели. Необходимо работать над моделью, добавляя и исключая независимые переменные, чтобы получить высокие значения R и T-статистики.

Анализ методом регрессии с фиктивными переменными

Один из приемов регрессионного анализа — метод фиктивных переменных для представления условий, не определяемых в серии расчетов. В качестве таких переменных берутся значения 0 и 1. Например, магазин Toys «R» Us, имеющий запас модной игрушки — условие, которое нельзя выразить численным значением, — резко увеличивает объем продаж. В совокупности данных наличие и отсутствие запаса можно обозначить ранговыми переменными 1 и 0 соответственно.

Используя гипотетическую совокупность данных по магазину Toys «R» Us, можно понять, как работают эти переменные (табл. 6).

Таблица 6.

Выводы регрессивного анализа устанавливают отношения между модной игрушкой и уровнем продаж:

Это идеальная модель, поскольку разброс на 100% объясняется среднеквадратичной погрешностью, и T-статистика работает прекрасно. T-статистика огромна. Уровень продаж составляет $100 000, когда модная игрушка отсутствует в ассортименте, и увеличивается на $100 000, когда она появля-ется. Уравнение регрессии по данным электронной таблицы имеет вид:

Объем продаж = 100 000Х + $100 000

Если вожделенная игрушка имеется в магазине, X = 1 и объем продаж подскакивает до $200 000, если не имеется, Х = 0 и продажи возвращаются на уровень $100 000. Фиктивные переменные весьма полезны и могут использоваться для установления соответствий между немасштабными данными, такими как наличие запасов или количества выходных, с поддающимися измерению данными, такими как температура, процентная ставка и дефекты продукции. В результате получаются удобные регрессивные модели.

Другие методы прогнозирования

Анализ временных рядовоснован на изменениях отношений во времени. В нашем примере с мороженым данные по температуре и объемам продаж наносились на график без учета времени. В зависимость, полученную методом регрессии, время не входит. Очевидно, что продажи Ben & Jerry’s зависят от сезона. В анализе временных рядов данные наносятся на график в соответствии со временем их поступления. Затем предпринимается попытка «разложить» разброс данных на следующие элементы:

  • Основная тенденция — рост, снижение, неизменность (долгосрочный критерий).
  • Циклы — часовые, дневные, недельные, месячные (краткосрочные паттерны).
  • Случайные отклонения — необычные или нерегулярные отклонения, обусловленные уникальными событиями и природными катаклизмами.

Для выявления тенденции и циклов используются скользящее среднее и регрессионный анализ. Как вы понимаете, прогнозирование методом временных рядов — затяжной процесс, который невозможно проиллюстрировать коротким и простым примером. Однако полезно как минимум знать о существовании этого метода.

Ключевые понятия

Дерево решений — способ графического и количественного представления разнообразных исходов делового решения.

Невозвратные расходы — инвестиции, осуществленные в прошлом и никак не влияющие на будущие инвестиционные решения.

Ожидаемая монетарная ценность — выраженная в деньгах стоимость решения, определенная с учетом вероятности и стоимости всех возможных исходов.

Накопленная стоимость — общая будущая стоимость потоков денежных средств при условии реинвестирования всех получаемых доходов.

Чистая приведенная стоимость (NPV) — общая текущая стоимость всех потоков денежных средств, «дисконтированная» к сегодняшнему доллару.

Внутренняя норма прибыли (IRR) — ставка дисконта, при которой чистая текущая стоимость потоков денежных средств в сегодняшних долларах равна нулю.

Распределение вероятностей — график, на котором представлены все возможные исходы с соответствующими вероятностями их наступления.

Биномиальное распределение — распределение вероятностей всего с двумя возможными исходами.

Нормальное распределение — распределение в форме колоколообразной кривой, учитывающее все возможные исходы.

Среднеквадратичное отклонение (σ)— мера дисперсии (ширины) нормального распределения.

Среднее арифметическое (μ)— среднее арифметическое всех исходов.

Величина Z — инструмент для измерения вероятностей наступления конкретных ситуаций на нормальной кривой.

Кумулятивная функция распределения— форма нормального распределения, характеризующая вероятность того, что все возможные исходы окажутся меньше или равны определенному значению.

Регрессия — математический метод прогнозирования с использованием линейных уравнений для объяснения зависимостей между множественными причинами и следствиями

Деревья решений – общие принципы работы

Автор: Акобир Шахиди
Источник: http://www.basegroup.ru/trees/description.htm

Введение

Стремительное развитие информационных технологий, в частности, прогресс в методах сбора, хранения и обработки данных позволил многим организациям собирать огромные массивы данных, которые необходимо анализировать. Объемы этих данных настолько велики, что возможностей экспертов уже не хватает, что породило спрос на методы автоматического исследования (анализа) данных, который с каждым годом постоянно увеличивается.

Деревья решений – один из таких методов автоматического анализа данных. Первые идеи создания деревьев решений восходят к работам Ховленда (Hoveland) и Ханта(Hunt) конца 50-х годов XX века. Однако, основополагающей работой, давшей импульс для развития этого направления, явилась книга Ханта (Hunt, E.B.), Мэрина (Marin J.) и Стоуна (Stone, P.J) «Experiments in Induction», увидевшая свет в 1966г.

Терминология

Введем основные понятия из теории деревьев решений, которые будут употребляться в этой и последующих статьях.

Название Описание
Объект Пример, шаблон, наблюдение
Атрибут Признак, независимая переменная, свойство
Метка класса Зависимая переменная, целевая переменная, признак определяющий класс объекта
Узел Внутренний узел дерева, узел проверки
Лист Конечный узел дерева, узел решения
Проверка (test) Условие в узле

Что такое дерево решений и типы решаемых задач

Деревья решений – это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение.

Под правилом понимается логическая конструкция, представленная в виде «если … то …».

Область применения деревья решений в настоящее время широка, но все задачи, решаемые этим аппаратом могут быть объединены в следующие три класса:

  • Описание данных: Деревья решений позволяют хранить информацию о данных в компактной форме, вместо них мы можем хранить дерево решений, которое содержит точное описание объектов.
  • Классификация: Деревья решений отлично справляются с задачами классификации, т.е. отнесения объектов к одному из заранее известных классов. Целевая переменная должна иметь дискретные значения.
  • Регрессия: Если целевая переменная имеет непрерывные значения, деревья решений позволяют установить зависимость целевой переменной от независимых(входных) переменных. Например, к этому классу относятся задачи численного прогнозирования(предсказания значений целевой переменной).

Как построить дерево решений?

Пусть нам задано некоторое обучающее множество T, содержащее объекты (примеры), каждый из которых характеризуется m атрибутами (атрибутами), причем один из них указывает на принадлежность объекта к определенному классу.

Идею построения деревьев решений из множества T, впервые высказанную Хантом, приведем по Р. Куинлену (R. Quinlan).

Пусть через 1, C2, … Ck> обозначены классы(значения метки класса), тогда существуют 3 ситуации:

  1. множество T содержит один или более примеров, относящихся к одному классу Ck. Тогда дерево решений для Т – это лист, определяющий класс Ck;
  2. множество T не содержит ни одного примера, т.е. пустое множество. Тогда это снова лист, и класс, ассоциированный с листом, выбирается из другого множества отличного от T, скажем, из множества, ассоциированного с родителем;
  3. множество T содержит примеры, относящиеся к разным классам. В этом случае следует разбить множество T на некоторые подмножества. Для этого выбирается один из признаков, имеющий два и более отличных друг от друга значений O1, O2, … On. T разбивается на подмножества T1, T2, … Tn, где каждое подмножество Ti содержит все примеры, имеющие значение Oi для выбранного признака. Это процедура будет рекурсивно продолжаться до тех пор, пока конечное множество не будет состоять из примеров, относящихся к одному и тому же классу.

Вышеописанная процедура лежит в основе многих современных алгоритмов построения деревьев решений, этот метод известен еще под названием разделения и захвата (divide and conquer). Очевидно, что при использовании данной методики, построение дерева решений будет происходит сверху вниз.

Поскольку все объекты были заранее отнесены к известным нам классам, такой процесс построения дерева решений называется обучением с учителем (supervised learning). Процесс обучения также называют индуктивным обучением или индукцией деревьев (tree induction).

На сегодняшний день существует значительное число алгоритмов, реализующих деревья решений CART, C4.5, NewId, ITrule, CHAID, CN2 и т.д. Но наибольшее распространение и популярность получили следующие два:

  • CART (Classification and Regression Tree) – это алгоритм построения бинарного дерева решений – дихотомической классификационной модели. Каждый узел дерева при разбиении имеет только двух потомков. Как видно из названия алгоритма, решает задачи классификации и регрессии.
  • C4.5 – алгоритм построения дерева решений, количество потомков у узла не ограничено. Не умеет работать с непрерывным целевым полем, поэтому решает только задачи классификации.

Большинство из известных алгоритмов являются «жадными алгоритмами». Если один раз был выбран атрибут, и по нему было произведено разбиение на подмножества, то алгоритм не может вернуться назад и выбрать другой атрибут, который дал бы лучшее разбиение. И поэтому на этапе построения нельзя сказать даст ли выбранный атрибут, в конечном итоге, оптимальное разбиение.

Этапы построения деревьев решений

При построении деревьев решений особое внимание уделяется следующим вопросам: выбору критерия атрибута, по которому пойдет разбиение, остановки обучения и отсечения ветвей. Рассмотрим все эти вопросы по порядку.

Правило разбиения. Каким образом следует выбрать признак?

Для построения дерева на каждом внутреннем узле необходимо найти такое условие (проверку), которое бы разбивало множество, ассоциированное с этим узлом на подмножества. В качестве такой проверки должен быть выбран один из атрибутов. Общее правило для выбора атрибута можно сформулировать следующим образом: выбранный атрибут должен разбить множество так, чтобы получаемые в итоге подмножества состояли из объектов, принадлежащих к одному классу, или были максимально приближены к этому, т.е. количество объектов из других классов («примесей») в каждом из этих множеств было как можно меньше. Были разработаны различные критерии, но мы рассмотрим только два из них:

Алгоритм C4.5, усовершенствованная версия алгоритма ID3 (Iterative Dichotomizer), использует теоретико-информационный подход. Для выбора наиболее подходящего атрибута, предлагается следующий критерий:

где, Info(T) – энтропия множества T, а

Множества T1, T2, … Tn получены при разбиении исходного множества T по проверке X. Выбирается атрибут, дающий максимальное значение по критерию (1). Впервые эта мера была предложена Р. Куинленом в разработанном им алгоритме ID3. Кроме вышеупомянутого алгоритма C4.5, есть еще целый класс алгоритмов, которые используют этот критерий выбора атрибута.

Алгоритм CART использует так называемый индекс Gini (в честь итальянского экономиста Corrado Gini), который оценивает «расстояние» между распределениями классов.

Где c – текущий узел, а pj – вероятность класса j в узле c.

CART был предложен Л.Брейманом (L.Breiman) и др.

Правило остановки. Разбивать дальше узел или отметить его как лист?

В дополнение к основному методу построения деревьев решений были предложены следующие правила:

  • Использование статистических методов для оценки целесообразности дальнейшего разбиения, так называемая «ранняя остановка» (prepruning). В конечном счете «ранняя остановка» процесса построения привлекательна в плане экономии времени обучения, но здесь уместно сделать одно важное предостережение: этот подход строит менее точные классификационные модели и поэтому ранняя остановка крайне нежелательна. Признанные авторитеты в этой области Л.Брейман и Р. Куинлен советуют буквально следующее: «Вместо остановки используйте отсечение».
  • Ограничить глубину дерева. Остановить дальнейшее построение, если разбиение ведет к дереву с глубиной превышающей заданное значение.
  • Разбиение должно быть нетривиальным, т.е. получившиеся в результате узлы должны содержать не менее заданного количества примеров.

Этот список эвристических правил можно продолжить, но на сегодняшний день не существует такого, которое бы имело большую практическую ценность. К этому вопросу следует подходить осторожно, так как многие из них применимы в каких-то частных случаях.

Правило отсечения. Каким образом ветви дерева должны отсекаться?

Очень часто алгоритмы построения деревьев решений дают сложные деревья, которые «переполнены данными», имеют много узлов и ветвей. Такие «ветвистые» деревья очень трудно понять. К тому же ветвистое дерево, имеющее много узлов, разбивает обучающее множество на все большее количество подмножеств, состоящих из все меньшего количества объектов. Ценность правила, справедливого скажем для 2-3 объектов, крайне низка, и в целях анализа данных такое правило практически непригодно. Гораздо предпочтительнее иметь дерево, состоящее из малого количества узлов, которым бы соответствовало большое количество объектов из обучающей выборки. И тут возникает вопрос: а не построить ли все возможные варианты деревьев, соответствующие обучающему множеству, и из них выбрать дерево с наименьшей глубиной? К сожалению, это задача является NP-полной, это было показано Л. Хайфилем (L. Hyafill) и Р. Ривестом (R. Rivest), и, как известно, этот класс задач не имеет эффективных методов решения.

Для решения вышеописанной проблемы часто применяется так называемое отсечение ветвей (pruning).

Пусть под точностью (распознавания) дерева решений понимается отношение правильно классифицированных объектов при обучении к общему количеству объектов из обучающего множества, а под ошибкой – количество неправильно классифицированных. Предположим, что нам известен способ оценки ошибки дерева, ветвей и листьев. Тогда, возможно использовать следующее простое правило:

  • построить дерево;
  • отсечь или заменить поддеревом те ветви, которые не приведут к возрастанию ошибки.

В отличии от процесса построения, отсечение ветвей происходит снизу вверх, двигаясь с листьев дерева, отмечая узлы как листья, либо заменяя их поддеревом. Хотя отсечение не является панацеей, но в большинстве практических задач дает хорошие результаты, что позволяет говорить о правомерности использования подобной методики.

Правила

Иногда даже усеченные деревья могут быть все еще сложны для восприятия. В таком случае, можно прибегнуть к методике извлечения правил из дерева с последующим созданием наборов правил, описывающих классы.

Для извлечения правил необходимо исследовать все пути от корня до каждого листа дерева. Каждый такой путь даст правило, где условиями будут являться проверки из узлов встретившихся на пути.

Преимущества использования деревьев решений

Рассмотрев основные проблемы, возникающие при построении деревьев, было бы несправедливо не упомянуть об их достоинствах:

  • быстрый процесс обучения;
  • генерация правил в областях, где эксперту трудно формализовать свои знания;
  • извлечение правил на естественном языке;
  • интуитивно понятная классификационная модель;
  • высокая точность прогноза, сопоставимая с другими методами (статистика, нейронные сети);
  • построение непараметрических моделей.

В силу этих и многих других причин, методология деревьев решений является важным инструментом в работе каждого специалиста, занимающегося анализом данных, вне зависимости от того практик он или теоретик.

Области применения деревьев решений

Деревья решений являются прекрасным инструментом в системах поддержки принятия решений, интеллектуального анализа данных (data mining). В состав многих пакетов, предназначенных для интеллектуального анализа данных, уже включены методы построения деревьев решений. В областях, где высока цена ошибки, они послужат отличным подспорьем аналитика или руководителя

Деревья решений успешно применяются для решения практических задач в следующих областях:

  • Банковское дело. Оценка кредитоспособности клиентов банка при выдаче кредитов.
  • Промышленность. Контроль за качеством продукции (выявление дефектов), испытания без разрушений (например проверка качества сварки) и т.д.
  • Медицина. Диагностика различных заболеваний.
  • Молекулярная биология. Анализ строения аминокислот.

Это далеко не полный список областей где можно использовать деревья решений. Не исследованы еще многие потенциальные области применения.

Дерево решений в теории игр

Как сделать правильный выбор в стратегически важных ситуациях, когда успех зависит от выбора других «участников проекта» или от обстоятельств, с Вами не связанных? Изучением этой темы занят отдельный раздел прикладной математики – теория игр, которая помогает «математически» выбрать поведение в таких ситуациях.

Что делать? Создать модель, предсказывающую итоговое значение (например, выигрыш, сумму прибыли или затрат) при различных исходных данных и условиях.

Принятие решений может происходить в условиях определенности (все данные известны точно), условиях неопределенности (точных данных нет), условиях риска (данные в форме вероятностных распределений). Для третьего варианта решение основывается на вероятности появления каждого из альтернативных вариантов развития событий.

Решение на ветвях. Не случайные случайности

Метод построения дерева решений используют, когда нужно принять решение в условиях неопределенности, когда каждое решение зависит от исхода предыдущего или исходов испытаний, или некоторых заданных условий, появляющихся с оппределенной вероятностью.

Дерево решений позволяет визуально и аналитически оценить результаты выбора различных решений и используется в области статистики и анализа данных для прогнозных моделей.

Подробнее о структуре. Дерево решений состоит из веток с атрибутами (от них зависит результат – целевая функция) и листьев со значениями целевой функции (решающие вершины — результат выбора определенного значения атрибута), а также узлов – случайных вершин, в которых определены возможные варианты развития событий с определенного момента. «Растет» дерево до тех пор, пока альтернативные варианты не начнут вести к аналогичным или закономерно повторяющимся вариантам.

Рассмотрим пример создания дерева решений для задачи теории игр.
Колесо разделено на две области: белую и красную и управляется двумя кнопками: сильное и легкое вращение. В белой области колесо останавливается с вероятностью 0,3. В красной – 0,7.

Построим дерево решений:
1) Выбираем первое звено – исходное действие, которое может развиваться по нескольким «веткам» — вращение колеса.
2) Определяем критерий, по которому далее будет происходить распределение – кнопка для сильного (С) или легкого (Л) вращения.
3) Параметр разветвления – цвет области на колесе.
4) Над «ветвями» указываем возможные варианты (белый (Б) и красный (К) цвет) и вероятности их появления (учтем их далее – 0,3 и 0,7, соответственно).
5) Указываем результат – «лист» на каждой «ветке», используя исходную таблицу возможных выигрышей.
6) Вычисляем вероятность получения прибыли для каждого «листа».
7) Определяем полную вероятность для каждого варианта по исходному критерию (для каждой из двух кнопок, которые можно выбрать).

Подведем итоги игры:
— если выберете легкое вращение, выигрыш 240+140 = 380 (вариант гарантированно принесет прибыль);
— для сильного вращения получаете (-750)+700 = (-50) (выбор может привести к затратам).

ТОП-2 лучших брокеров бинарных опционов, дающих бонусы при открытии счета:
  • Бинариум
    Бинариум

    1 место! Самый старый и надежный брокер бинарных опционов. Бонусы за открытие счета! Лучший вариант для начинающих трейдеров.

  • ФинМакс
    ФинМакс

    У этого брокера больше всего торговых инструментов. Подходит для опытных трейдеров.

Добавить комментарий