اختبار قابلية الاستخدام ، مع المستخدمين الحقيقيين ، هو واحد من المجالات الرئيسية التي تخطيها الكثير من مصممي الويب. في كثير من الأحيان ، يكون هناك القليل من المال في الميزانية لإجراء الاختبارات ، ولكن اختبار قابلية الاستخدام عن بُعد يمكن أن يكون رخيصًا نسبيًا ، ويمكن أن تحدث النتائج فارقًا كبيرًا في تحويلات الموقع.
للتدليل على قوة اختبار قابلية الاستخدام في التصميم ، تعاوننا مع UserTesting و الورشة المثلى لتشغيل بعض الاختبارات على Yelp كجزء من تمرين إعادة التصميم.
لقد اخترنا على وجه التحديد اختبارات إمكانية الاستخدام عن بُعد نظرًا لأنها سريعة جدًا وبأسعار معقولة جدًا للتشغيل مقارنةً بمجموعات التركيز وغيرها من اختبارات التصميم المعملية. كانت جميع هذه الاختبارات غير متفاعلة بحيث يمكن للمستخدمين التفاعل مع موقع Yelp الإلكتروني في راحة منازلهم لتحقيق أفضل النتائج الطبيعية. شجعناهم على التفكير بصوت عال ومن ثم تسجيل ردود أفعالهم.
لا ينحصر بحث المستخدم في كتابة تقارير معقدة - بل يتعلق بطرح الأسئلة الصحيحة واستخدام الأدلة لدعم قرارات التصميم. في هذه المقالة ، سنلقي نظرة على كيفية اختيارنا لمستخدمينا ، وكيفية إعدادنا للمهام ، وما هي النتائج ...
واحدة من الخطوات الأولى هي معرفة من الذي يختبر التصاميم الخاصة بك. في تجربتنا ، وجدنا أن التركيبة السكانية ليست مهمة مثل السلوك والألفة مع التكنولوجيا. ما معدل استخدامهم لمنصات مشابهة ، وما مدى براعتهم؟
الديموغرافيات ليست مهمة مثل السلوك والألفة مع التكنولوجيا
Yelp لديها قاعدة مستخدمين ضخمة (138 مليون زائر شهري فريد ، وفقا ل Yelp's Q2 2014 numbers ) حتى أن موقعنا المعاد تصميمه لا يزال بحاجة إلى أن يكون معتادًا على المستخدم الحالي العادي - لن يكون من المنطقي أن ننفر مستخدمي الطاقة الحاليين لصالح جذب المستخدمين لأول مرة.
لم نركز على العمر أو الجنس أو مستوى الدخل أو الخبرة في استخدام الويب ، نظرًا لأن مستخدمي Yelp يأتون من جميع الخلفيات. نظرًا لأننا نتعامل مع البيانات النوعية ، لم نكن بحاجة إلى القلق بشأن الدلالة الإحصائية. تابعنا أفضل ممارسات الصناعة وركضنا دراستنا مع ما مجموعه 5 مستخدمين والتي من شأنها أن تساعد في الكشف عن 85 ٪ من قضايا الاستخدام (جيدة بما فيه الكفاية لممارسة).
واحدة من المهام المطلوبة للمستخدمين لتسجيل الدخول إلى حساب. هذا يعني أننا كنا بحاجة إلى إنشاء شريحتين لقاعدة الاختبار الخاصة بنا: واحدة مع حسابات Yelp (3 مستخدمين) ، وواحدة بدون (2 مستخدم). بالنسبة للجزء المتعلق بحسابات Yelp ، اخترنا فقط المشاركين الذين كانوا من مستخدمي Yelp لمدة أقل من 6 أشهر لزيادة احتمال احتمال أن يكونوا مستخدمين يتمتعون بالقدرة.
أخيرًا ، من أجل البساطة ، قمنا باختبار موقع ويب Yelp فقط على أجهزة سطح المكتب ، وليس على أجهزة الجوال. (إذا كان هذا أكثر من مجرد تمرين ، فقد اختبرنا التجربة على أكبر عدد ممكن من الأجهزة).
يجب أن يبدأ كل اختبار للاستخدام مع السؤال "ماذا نريد أن نتعلم؟"
بالنسبة إلينا ، أردنا معرفة كيفية إكمال مستخدمي Yelp شبه المتكررين للمهام الشائعة جدًا (لتحديد الميزات الأكثر أهمية) ومهمة واحدة أقل شيوعًا على الأقل (لاختبار مدى حدّة الميزات المتقدمة).
قدمنا لجميع المستخدمين هذه الأنواع من المهام الشائعة:
أردنا معرفة وقت اختيار كل من مجموعات المستخدمين للبحث في مقابل التصفح ، وكيفية تفاعلهم مع الفلاتر ، وكيفية اتخاذهم قرارًا بشأن النشاط التجاري الذي سيزورونه.
أما بالنسبة للمهام الأقل شيوعًا ، فقد قدمنا مهمة مختلفة لكل مجموعة مستخدمين.
وبما أننا سمعنا عدة شكاوى من مستخدمي Yelp المسجلين حول ميزات الإشارة المرجعية والقوائم ، فقد طلبنا من المستخدمين المسجلين (المجموعة 1) حفظ الأنشطة التجارية للرجوع إليها فيما بعد. بالنسبة إلى المستخدمين غير المسجلين (المجموعة 2) ، طلبنا منهم العثور على حدث.
فيما يلي جميع المهام التي خصصناها لكلتا المجموعتين. بعد كل اختبار ، سألنا المستخدمين عما إذا كانوا قادرين على إكمال المهمة بنجاح ومستوى السهولة أو الصعوبة (المعروف باسم سؤال سهل واحد ).
المهام المشتركة (المخصصة لكلتا المجموعتين)
مهام المجموعة 1 (أصحاب حسابات Yelp)
مهام المجموعة 2 (وليس أصحاب الحسابات)
بمجرد الانتهاء من كل هذا ، فقد حان الوقت لبدء الاختبار. استغرق الأمر حوالي ساعة للحصول على النتائج قبل أن نتمكن من مشاهدة ردود أفعال المستخدم وتحليل البيانات.
للمقارنة مع البيانات النوعية التي لدينا الآن ، أجرينا اختبارًا كميًا مع 35 مستخدمًا بفرز بطاقة مغلقة واختبار النقرة الأولى. يمكنك معرفة المزيد عن مهام المستخدم الكمية ، ولكن سنلخص فقط أهم الإحصاءات:
لمعرفة كيف تنعكس هذه الأفكار في التصميم الجديد ، يمكنك اللعب مع انخفاض الدقة النموذج الصرخة ، وتحقق من النموذج النهائي عالية الدقة .