Für die Forschung an APT-Detektionsansätzen werden für die Entwicklung, das Testen und die Evaluation Daten von APT-Angriffen benötigt. Es existieren öffentlich verfügbare Datensätze, die für diese Zwecke verwendet werden, diese sind allerdings in der Literatur kontontrovers diskutiert. Kritik bezieht sich auf die Qualität der Daten sowie den abgebildeten Angriffen, die oft nicht echten APT-Angriffen entsprechen oder nicht alle relevanten Charakteristiken wie beispielsweise Persistenz oder Lateralbewegung von APT-Angriffen beinhalten. Aus diesem Grund erstellen Forschende oft eigene Datensätze für die Entwicklung und Evaluation ihrer APT-Detektionsansätze. Diese Datensätze allerdings werden selten veröffentlicht. Die resultierenden Evaluationen sind daher oft schwer direkt miteinander zu vergleichen, da die Daten unterschiedlich sind. Dies hat schwerwiegende Implikationen für die Wissenschaftlichkeit im Feld der APT-Detektion.
Dieses Problem soll mit diesem Projekt gelöst werden. APT-Detektionsansätze sollen in einem einheitlichen Framework reimplementiert werden, um anschließend auf einheitlichen und hochqualitativen Daten von echten APT-Angriffen evaluiert zu werden. Dabei soll sichergestellt werden, dass die Daten in einer einheitlichen Repräsentation vorliegen, auf deren Basis die Datenverarbeitung und Detektion der einzelnen Detektionsansätze erfolgen kann. Es ist geplant, dass der Datensatz sowie die Infrastruktur und die Reimplementation als Open-Source veröffentlicht werden.
Somit wird eine Basis für Vergleichbarkeit unter verschiedenen Ansätzen zur APT-Angriffsdetektion geschaffen und trägt insgesamt zur Verbesserung der Wissenschaftlichkeit des Forschungsbereiches bei.