Załóżmy, że odpowiadamy w przedsiębiorstwie za realizację kampanii marketingowych. W ramach kampanii, ma zostać skierowana informacja elektroniczna do wybranej grupy klientów o umieszczeniu w ofercie nowego produktu. Produkt jest w kilku odmianach, uzależnionych od rodzajów klientów. Produkt jest w atrakcyjniej cenie. Założenie jest takie, że kampania jest ograniczona do maksymalnie 1000 klientów, jako nagroda za dotychczasową aktywność. Istotne jest to, aby skierować ofertę do klientów, którzy potencjalnie byliby zainteresowani zakupem.
Proces dla realizacji takiej kampanii mógłby wyglądać następująco:
W takim procesie do opisu reguł, które stwierdzą, którzy Klienci będą zainteresowani ofertą, a którzy nie, można wykorzystać język PMML (ang. Predictive Model Markup Language). Elementy zawarte na powyższym diagramie w ramce, mogą zostać opisane za pomocą tego języka.
Język PMML jest językiem służącym do prezentacji modeli przetwarzania danych (ang. data mining models) lub modeli analitycznych służących do tworzenia prognoz (ang. Predictive analytic models). Język pozwala na zapisanie reguł, pozwalających na wyciągnięcie wzorców z dostępnych danych. Podstawą działania są modele matematyczne/statystyczne umożliwiające na poznanie ukrytych wzorców w dużych zestawach historycznych danych.
Struktura PMML, zgodnie z tym co podaje strona IBM.com, składa się z następujących elementów:
- Słownik danych (ang. Data dictionary) – jest wynikiem analizy danych i określa, które dane wejściowe są najbardziej użyteczne do rozwiązania problemu.
- Schemat przetwarzania (ang. Mining Schema) – określa strategię postępowania z wartościami granicznymi i brakującymi.
- Modyfikacje danych (ang. Data Transformations) – określa jakie obliczenia, operacje powinny zostać wykonane na danych źródłowych przed ich przekazaniem do dalszego etapu.
- Definicja modelu (ang. Model Definition) – zawiera strukture i zmienne użyte do budowy modelu.
- Dane wyjściowe (ang. Outputs) – definiuje oczekiwany wynik działania modelu.
- Dane zwrotne (ang. Targets) – określa modyfikacje na danych wyjściowych przed ich przekazaniem dalej.
- Wyjaśnienie modelu (ang. Model Explanation) – zawiera wskaźniki wykonania przy przetwarzaniu danych przez model.
- Weryfikacja modelu (ang. Model Verification) – zawiera zestaw przykładowych danych wejściowych z oczekiwanymi danymi wynikowymi.