Das Stammtischniveau findet sich wohl eher in der Ignoranz der Menschen, die denken, dass persönliche Anekdoten und Verschwörungsdenken ("werbefinanziert") besser wären als ein Testaufbau mit einer Messung um die Wahrheit herauszufinden.
Unter der Annahme, dass die Tests immer die Realität abbilden würden, wäre ich da weitestgehend bei dir. Dass das nicht der Fall ist liegt m.M.n. weder an Werbung, Verschwörungen oder sonstigen Fügungen des Universums, sondern einfach daran, dass ein Test im Labor immer (per Definition) ein Modell darstellt. Zwischen Modell und Realität liegt immer eine Differenz und die Frage nach der Größe dieser Differenz kann man praktisch kaum beantworten.
Das siehst du in Geisteswissenschaften wie der Psychologie, wo sich akademische Studien teils nicht replizieren lassen (siehe Replikationskrise) und somit Zweifel an deren Ergebnissen aufkommen. In der Technik ist die Formel 1 ein hervorragendes Beispiel, wo dreistellige Millionenbudgets in die Entwicklung, Modellierung des Testung von Fahrzeugen investiert wird, die sich auf der Strecke aus unerfindlichen Gründen ganz anders verhalten (Grüße gehen raus an dich, Toto).
Und die Ursache ist natürlich nicht, dass dort nur Pfeifen am Werk sind, sondern dass es einfach unglaublich schwierig ist, einen Test zu bauen, der nur (und ausschließlich) das misst, was man gerade ermitteln will.
Dass anekdotische Pseudoevidenz nicht viel besser ist, steht auch außer Frage. Aber wenn das anekdotische dem Test komplett widerspricht, stellt sich ja nun die Frage, ob man einfach statistisch gerade "Glück" hat und in dem Bekanntenkreis lebt, der wirklich zufällig die besten Exemplare bekommen hat, oder ob der Test nicht adäquat war. Und bei einem Test einer Zeitschrift - bei allem Respekt - ist es jetzt nicht völlig unrealistisch, dass da methodisch eben nicht alles passt (wenn es den hauptberuflichen 100-Mann-Entwicklungsabteilungen in der F1 passiert, dann kann das wohl auch bei einer "kleinen" Zeitschrift vorkommen).