Deutsche Version
An den oben genannten Koordianten gibt
es nichts zu finden, außer nasse Füsse!
Oha, Teil I und II gelöst? Hoffentlich auf die richtige Art und
Weise!
Zur neuen Aufgabe: Jeder kennt glaube ich die Begrüßung von
Amazon: Kunden die ... kauften kauften auch ... Und genau das
machen wir jetzt auch!
Die Idee ist, dass zwischen Kundenvorlieben für bestimmte
Produkte Abhängigkeiten bestehen die dem Unternehmen vielleicht gar
nicht klar sind, aber dennoch von Bedeutung.
Wenn wir Adressaten für eine Werbekampagne brauchen erzielen wir
potenziell eher Erfolg bei den Kunden die das eine Produkt schon
gekauft haben aber das andere nicht.
Wenn wir denn erst mal wissen was diese zwei Produkte sind. Dies
ist eine Anwendung der noch jungen BI-Wissenschaft. BI steht für
Business Intelligence, Wikipedia sagt euch mehr darüber.
Und wie machen wir das jetzt? Wir brauchen für jedes Produkt die
Anzahl von Kunden die es in ihren Bestellungen hatten, und dann für
jedes andere Produkt die Anzahl wie oft dieses auch von diesen
Kunden gekauft wurde.
Unten seht ihr das Ergebnis einer Abfrage, wobei einige Ziffern
wie immer ausgeblendet sind. Baut die Abfrage nach und ihr könnt
die fehlenden Werte rekonstruieren.
Folgende Angaben helfen euch beim richtigen Einschränken der
Abfrage: Verknüpfungen in denen das Referenzprodukt von weniger als
15 verschiedenen Kunden gekauft wurde nehmen wir als statistich
nicht relevant an, und Verknüpfungen wo das Ziel-Produkt 0 mal in
der Verknüpfung vorkommt interessieren natürlich auch nicht.
Sortiert nach dem prozentualen Anteil der beiden Bestell-Anzahlen
abwärts, und wenn ihr eine Ergebnismenge von 4319 Zeilen erhaltet
seit ihr am Ziel!
Dies ist der dritte einer Serie von Mysterycaches über
Datenanalyse.
Teil I: It's not about the numbers
Teil II: It's sometimes about the numbers
Teil III: It's only about the numbers
Teil IV: It's again about the numbers
Teil V: It's again about the numbers - reloaded
English Language version
There is nothing to be found at the
coordinates, just a spot to get your feet wet.
So, you completed part I and II now? I just hope you learned the
right way by now!
Your new task: Probably everybody who shopped at Amazon knowns
the line "Customers who bought ... also bought ..." and that is
exactly what we are going to do now!
The basic idea is that there are dependencies in customers'
preferences preferences for specific products which are not obvious
but still important.
If we were to find adresses for a mailing campaign we could be
certain to have a better response from customers who already bought
one product of the pair but not the other.
If we knew what these two products might be. This is an application
of the relativly young BI science. BI is Business Intelligence,
Wikipedia will tell you more about it.
And how are we going to do this now? For every product we need
the number of customers that had it on their orders, and then for
each other product we need the number how often they ordered this
other one.
Below you see a result table with some numbers blocked out.
Rebuild the query and you can reconstruct the missing values.
You will need the following restrictions: we treat dependencies
where the reference product was bought by less than 15 distict
customers as not statistically relevant, and those where the target
product was bought 0 times are also not our focus.
Sort in descending order on the percentage of both customer
numbers, and if you end up with 4319 rows you're done!
This is the third part of a set of mysteries that focus on data
analysis techniques.
Part I: It's not about the numbers
Part II: It's sometimes about the numbers
Part III: It's only about the numbers
Part IV: It's again about the numbers
Part V: It's again about the numbers - reloaded
Die Formel
The formula
N 50° 4A.BCD
E 006° 1E.FGH
Die Werte
The values
Lösung überprüfen
Check your solution
Die Werte
The values
ReferenceProduct |
BoughtBy |
OtherProduct |
BoughtAlso |
Percentage |
xxxxx xxxxx xxx |
Bx |
xxxxx xxxxx xxx |
xH |
xx,xxxxxxxxxxx |
xxxxx xxxxx xxx |
xx |
xxxxx xxxxx xxx |
xx |
FA,xxxxxxxxxxx |
xxxxx xxxxx xxx |
xx |
xxxxx xxxxx xxx |
xC |
xx,Dxxxxxxxxxx |
xxxxx xxxxx xxx |
xG |
xxxxx xxxxx xxx |
xx |
xx,xxxxxxxxxxx |
xxxxx xxxxx xxx |
xx |
xxxxx xxxxx xxx |
Ex |
xx,xxxxxxxxxxx |
Vegie-spread |
15 |
Raclette Courdavault |
11 |
73,33333333333 |
Escargots de Bourgogne |
17 |
Camembert Pierrot |
12 |
70,58823529411 |
Escargots de Bourgogne |
17 |
Chang |
12 |
70,58823529411 |
Flotemysost |
27 |
Raclette Courdavault |
19 |
70,37037037037 |
Uncle Bob's Organic Dried Pears |
20 |
Raclette Courdavault |
14 |
70,00000000000 |
Spegesild |
23 |
Raclette Courdavault |
16 |
69,56521739130 |
Côte de Blaye |
19 |
Pavlova |
13 |
68,42105263157 |
Nord-Ost Matjeshering |
22 |
Camembert Pierrot |
15 |
68,18181818181 |
Nord-Ost Matjeshering |
22 |
Raclette Courdavault |
15 |
68,18181818181 |
Perth Pasties |
25 |
Raclette Courdavault |
17 |
68,00000000000 |
Chang |
28 |
Camembert Pierrot |
19 |
67,85714285714 |
Pavlova |
31 |
Raclette Courdavault |
21 |
67,74193548387 |
Zaanse koeken |
18 |
Camembert Pierrot |
12 |
66,66666666666 |
Tofu |
18 |
Konbu |
12 |
66,66666666666 |
Tofu |
18 |
Queso Cabrales |
12 |
66,66666666666 |
Mozzarella di Giovanni |
33 |
Raclette Courdavault |
22 |
66,66666666666 |
Gumbär Gummibärchen |
24 |
Raclette Courdavault |
16 |
66,66666666666 |
Ipoh Coffee |
26 |
Raclette Courdavault |
17 |
65,38461538461 |
Chartreuse verte |
26 |
Gorgonzola Telino |
17 |
65,38461538461 |