h1

Język wspierający przetwarzanie danych

Październik 23, 2012

Załóżmy, że odpowiadamy w przedsiębiorstwie za realizację kampanii marketingowych. W ramach kampanii, ma zostać skierowana informacja elektroniczna do wybranej grupy klientów o umieszczeniu w ofercie nowego produktu. Produkt jest w kilku odmianach, uzależnionych od rodzajów klientów. Produkt jest w atrakcyjniej cenie. Założenie jest takie, że kampania jest ograniczona do maksymalnie 1000 klientów, jako nagroda za dotychczasową aktywność. Istotne jest to, aby skierować ofertę do klientów, którzy potencjalnie byliby zainteresowani zakupem.

Proces dla realizacji takiej kampanii mógłby wyglądać następująco:


W takim procesie do opisu reguł, które stwierdzą, którzy Klienci będą zainteresowani ofertą, a którzy nie, można wykorzystać język PMML (ang. Predictive Model Markup Language). Elementy zawarte na powyższym diagramie w ramce, mogą zostać opisane za pomocą tego języka.

Język PMML jest językiem służącym do prezentacji modeli przetwarzania danych (ang. data mining models) lub modeli analitycznych służących do tworzenia prognoz (ang. Predictive analytic models). Język pozwala na zapisanie reguł, pozwalających na wyciągnięcie wzorców z dostępnych danych. Podstawą działania są modele matematyczne/statystyczne umożliwiające na poznanie ukrytych wzorców w dużych zestawach historycznych danych.

Struktura PMML, zgodnie z tym co podaje strona IBM.com,  składa się z następujących elementów:

  1. Słownik danych (ang. Data dictionary) – jest wynikiem analizy danych i określa, które dane wejściowe są najbardziej użyteczne do rozwiązania problemu.
  2. Schemat przetwarzania (ang. Mining Schema) – określa strategię postępowania z wartościami granicznymi i brakującymi.
  3. Modyfikacje danych (ang. Data Transformations) – określa jakie obliczenia, operacje powinny zostać wykonane na danych źródłowych przed ich przekazaniem do dalszego etapu.
  4. Definicja modelu (ang. Model Definition) – zawiera strukture i zmienne użyte do budowy modelu.
  5. Dane wyjściowe (ang. Outputs) – definiuje oczekiwany wynik działania modelu.
  6. Dane zwrotne (ang. Targets) – określa modyfikacje na danych wyjściowych przed ich przekazaniem dalej.
  7. Wyjaśnienie modelu (ang. Model Explanation) – zawiera wskaźniki wykonania przy przetwarzaniu danych przez model.
  8. Weryfikacja modelu (ang. Model Verification) – zawiera zestaw przykładowych danych wejściowych z oczekiwanymi danymi wynikowymi.
Reklamy

Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj /  Zmień )

Zdjęcie na Google+

Komentujesz korzystając z konta Google+. Wyloguj /  Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj /  Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj /  Zmień )

Połączenie z %s

%d blogerów lubi to: