Какие тесты вам нужны? Часть 2. Матрица видов тестирования

В первой части серии статей я рассуждала о том, от чего зависит выбор тестов. Имея в голове понимание того, что вы хотите добиться тестированием, можно делать следующий шаг — выбирать тесты. Для этого надо понимать, какие тесты бывают вообще.

Почти все статьи, посвященные видам тестирования, имеют группировку тестов по каким-нибудь категориям. Только это деление не везде совпадает. Вчитываясь в такие статьи, нередко обнаруживаешь расхождение терминологии у разных авторов.

Я ставлю перед собой цель разложить по полочкам, визуализировать многообразие тестов, чтобы помочь тем, кто выбирает, какие тесты им нужны, и тем, кто изучает само тестирование.

Я не берусь давать четкие определения видам тестирования в этой статье. Об интерпретации терминов, используемых для названия видов, речь пойдет в третьей части. Связано это разделение с объемом информации.

Классификация видов тестирования

Смотрите какой милый майнд мап с видами вина: Казалось бы, он полностью охватывает все виды вин. А теперь посмотрите на него еще раз и перечислите вина по странам производства, как они расставлены в супермаркете или в меню ресторана. Не получается? А как же тогда выбирать? Эта карта не подходит для выбора по производителям. Если присмотреться внимательнее — там есть приписка «по стилю и вкусу».

Вот так же и с видами тестов.

А критерий группировки может является ключевым критерием выбора.

Карта видов тестирования

Мне нравится подход, что использовался в статье про тестирование ПО на Википедии, поскольку рассмотрено большое множество разрезов.

Я взяла этот список за основу и дополнила информацией, почерпнутой из других источников и личного опыта и составила майнд мап (карту знаний). Мне эта карта бывает полезна в процессе планирования тестов — я проверяю, не забыла ли я чего. Делюсь схемкой с вами:

Названия тестов приведены на английском, чтобы избежать неточности перевода.

Цветокоды

Голубым выделены характеристики, применимые к тестовым наборам
Желтым выделены характеристики, применимые только к тест кейсам
Зелёным выделены универсальные характеристики

Про желтые блоки в карте знаний

Виды тестов, которые перечислены в узле «Сценарии» — это на самом деле названия методик подготовки сценариев. Соблюдение этих методик дает на выходе конкретные тесты. Поэтому, на мой взгляд, уместно приводить их как виды тестов.

Упомянутые методики принято считать видами тестов Черного ящика. Почему эти тесты на моей схеме не относятся к Black Box? Потому что даже тестируя спецификацию надо думать о том, что будет, если ввести значение больше допустимого, и как должна система реагировать на ошибки вообще. Об этом надо думать и при написании unit-тестов, которые к Black Box никак не относятся.

Про зелёные блоки в карте знаний

На самом деле эти названия — это виды требований. Тесты, покрывающие конкретный вид требования, логично называть тестами этого требования. Большинство названий тестов, помещенных в голубые блоки — тоже вылезло из названий требований. Например, «приложение должно быть отказоустойчивым» порождает тесты отказоустойчивости.

Зеленые блоки отличаются от голубых тем, что редко вообще упоминаются в русскоязычных обзорах видов тестирования. Однако если вы, к примеру, поищите словосочетание «suitability testing» вы найдете много полезного.

Как пользоваться картой

Мой майнд мап видов тестирования, по сути, является графом, конкретно — деревом. Моё любимое приложение XMind позволяет очень просто поменять структуру карты знаний на дерево и другие представления. Но в тексте много букв, поэтому дерево становится широким и не удобным для восприятия.

У этого дерева есть 10 больших веток — первый уровень графа — это критерии классификации. Очевидно, что они не являются сами по себе видами тестов.

Я надеюсь, что вам известно, чем отличается поиск в ширину от поиска в глубину. По моему глубокому убеждению ошибки в понимании и выборе тестов происходят из-за стремления найти удовлетворительно решение по-быстрее, что подталкивает на поиск в глубину. 2-уровневые (заголовок — перечень) списки видов тестирования этому весьма способствуют.

Искать надо в ширину. Потому что на каждой ветке приведенного графа есть тесты, которые вам нужны. Тоже следует делать при попытке охарактеризовать уже имеющиеся тестовые наборы. Один и тот же тест будет иметь несколько разных характеристик.

Критерии классификации

Приступим, пробежимся в ширину по верхнему уровню дерева.

1. Вид требований

Все тесты зависят от того, что требуется от разрабатываемого ПО.

Если нам есть что разрабатывать, значит есть что тестировать. Наличие формально описанных требований — вещь очень важная, но не является обязательной. Не важно, есть ли у вас бумажка, называемая «ТЗ»/«SRS» или нет — требования, на основе которых вы проводите проверку, всегда есть.

Мы можем уточнить, конечно, какие именно нужны операции или понять и сделать согласно своему видению, но так или иначе минимальные требование у нас уже есть.

Можно считать, что требований нет, если разработчики не поняли, что от них ждут, и не смогли приступить к работе. Я знаю хороших разработчиков, которые не приступают к разработке, пока не получат ответ на вопрос: «а для чего этот софт должен делать то-то и то-то? Какая конечная цель использования?»

Если же разработчики работают — значит требования есть, другим вопросом остается точность их понимания.

Например, «задача сделайте калькулятор, у которого будут кнопочки, и который будет выполнять все математические операции» содержит в себе кучу требований сама по себе.

Разберите имеющееся у вас представление о том, что ожидается от разрабатываемого ПО, по видам требований, которые вы видите в моем майнд мапе. Если вы стремитесь к полноценному тестовому покрытию, то

Если вам нужны только «минимально необходимые», а не «необходимые и достаточные» — используйте функциональные suitability и accuracy тесты.

Подробно о функциональных тестах речь пойдет в третьей части.

На этом шаге многие останавливаются. "Нам нужны функциональные тесты". Но надо идти дальше.

2. Объект тестирования

Самый плодородный подход к классификации тестов — это категоризация по объектам тестирования. Велико разнообразие технологий, интерфейсов, архитектур, функциональных предназначений и характеристик системы. Все требует своего подхода к тестированию. Отличаются методы и инструменты.

Приложу эту группу отдельно:

Справа я написала три группировки, они условны, поэтому не являются родительскими узлами. Потому что эти требования могут быть и функциональными, и не функциональными, в зависимости от того, что разрабатываем. В общем случае инфраструктурные мы будем проводить до и для передачи в production. А эксплуатационные мы будем проводить на prod-like среде, когда уже будет определено, на каком железе будет жить наша система.

Полное тестирование безопасности, например для сертификации в ФСБ, могут быть частью инфраструктурных тестов, если используются аппаратные способы защиты или внешние системные модули, которые мы не разрабатываем сами. А некоторые средства защиты будут «вшиты» в наш софт и тестироваться как часть функциональных требований.

Например, в рамках тестирования функции передачи сообщения о транзакции от банкомата к банку-эмитенту, мы проверим шифрование пин-кода.

Очень важно понимать, что

Как и тесты производительности, отказоустойчивости и т.п. — не всегда виды NFR.

Пример 1. Есть не функциональное требование «при сбое компонента его функции должны выполняться другим, параллельным компонентом». Соответственно, покрываться требование будет не функциональными тестами — стресс тестами, тестами надежности и стабильности.

Пример 2. Рассмотрим случай, когда отказоустойчивость является функциональным требованием. Например, разрабатывается и тестируется отказоустойчивый кластер, а не система, в которой он используется. Целью разработки является создание продукта, который будет обеспечивать отказоустойчивость. В этом случае мы имеем дело с функциональными тестами отказоустойчивости.

Пример 3. Разработка приложения Jmeter. Это — популярный инструмент для проведения нагрузочного тестирования. Его функционалом является нагрузочное тестирование. Это — случай, когда субъект тестирования стал объектом тестирования. Рекурсивненько, да? Тесты нагрузочного тестирования JMeter являются функциональными.

Еще возможные примеры: разработка криптомодуля (функциональные тесты ИБ), разработка интерфейса взаимодействия между системами (функциональные интеграционные тесты), разработка веб-интерфейса фронт-офиса как тонкого клиента при соблюдении разделения бизнес логики от представления данных (функциональные UI-тесты). И так далее.

Вот из-за таких случаев не уместно разделять функциональные тесты по видам функционала (только по видам требований). И не уместно относить сами функциональные тесты к объектам при категоризации «по объекту тестирования».

3. Знание системы

В зависимости от знания системы тесты бывают тестами черного, серого и белого ящика. Эти термины идут из Теории Управления, и я надеюсь, что они вам знакомы в более широком смысле, чем как виды тестов.

Рассматривать как монохромный ящик можно как всю систему целиком, так и ее отдельную часть.

Наиболее распространенным подходом к тестированию является проведение функциональных suitability тестов черного ящика. Еще их заодно называют acceptance тестами, но до приёмочных тестов мы еще не дошли, подождите. Именно на такое тестирование натаскивают большинство начинающих тестировщиков.

Весь мой цикл статей по выбору тестов нацелен на то, чтобы избавить читателей от этого заблуждения.

Подробно о влиянии знания системы на проведение тестирования я напишу отдельно.

4. Степень автоматизации

Про автоматизацию пишут везде и много. Я сама очень люблю эту тему.

Что мне не нравится, так это то, что автоматизацию чаще всего рассматривают в таком контексте: «вот у нас накопились регрессионные функциональные тесты, прогонять их некому, надо как-то чтобы оно само». Поэтому многие посмотрят на эту ветку дерева и скажут «ну, это потом».

Об автоматизации надо задуматься, отвечая на вопрос:

5. Степень изолированности компонентов

Протестировать систему «от-и-до» можно на безопасность, можно на соответствие стандартам, можно на удобство эксплуатации. Речь идет о масштабе — когда вы берёте все целиком. Можно проверять отдельные части, на разном уровне агрегации. Можно проверять не сами компоненты, а то, как они взаимодействуют — теряются ли, искажаются ли данные.

Выбор масштаба, на котором будет проводиться тот или иной тест, зависит от цели — какие ошибки вы ищете, какие требования хотите проверить. И еще от знания и доступности системы.

End-To-End тестирование может быть black box, например, на приёмочных испытаниях при первичной сдаче в эксплуатацию. А до передачи — grey box, когда тестировщики знают, как устроена система и где у нее узкие места. Заливают данные на самый передний вход и ждут течь из всех щелей и ожидаемый результат из самого заднего выхода. От знания системы зависит подготовка тестовых данных. Зная, где может прорвать, можно подсунуть то, что в нужную щель пролезет. При этом может быть так, что потенциально дефектный компонент не доступен сам по себе — поэтому речь не идет о тестировании компонента. Заводится вся машина, и дефекты могут быть обнаружены не только там, где ожидаются.

Если компонент изолировать и подавать данные на вход только в него и проверять результат только на его выходе — это будет тестирование компонента.

В зависимости от того, на сколько мелко крошить систему возникают расхождения в терминологии относительно видов тестирования. Об этом будет речь в другой части.

6. Время проведения тестирования

Я считаю, что такой подход приводит к тому, что достигнуть эффективного тестового покрытия невозможно.

Вопрос о времени проведения того или иного тестирования во многом зависит от методологии ведения проекта. По SCRUM вы будете брать только те тесты, которые можете успеть за итерацию. У вас будет зафиксирована дата релиза, и вы сможете предположить, когда уже пора сделать смоук, когда имеет смысл начать регресс, а все остальное время будете разгребать баг-фикс и проводить полноценные тесты новых фич. Билд может собираться каждый день, а на нем можно гонять смоук и/или регрессионные тесты. Кто-то собирает билд только перед релизом и сидит ночами, чтобы допроверить или перепроверить все, что можно успеть.

В моем понимании, черта, которая разделяет тесты по времени — это релиз. Часть тестов делается до релиза, внутри команды — это альфа тесты, часть — после передачи в эксплуатацию — это бэта, гамма, дельта… омега тесты.

Всем известен закон зависимости стоимости дефекта от времени его обнаружения. Поэтому максимум тестов должно выполняться на альфа стадии.

Под бэта тестами обычно понимают «пререлиз». Когда продукт вроде как готов, и его уже используют, но он все еще не является законченным. Практика полноценного бэта тестирования распространена в gamedev-индустрии и в open source-проектах.

7. Степень подготовленности тестов

Вы либо закладываете время на подготовку тестов, либо — нет.
У вас либо есть общий стандарт тест планов и отчетов о тестировании — либо нет.
Вы используете или собираетесь использовать систему управления тестами, или нет.

Как бы то ни было, даже если по началу по всем пунктам вы ответили «нет», это не значит, что на вашем проекте будет проводиться только исследовательское тестирование. Можно взять ТЗ и проверить, выполнено ли то, что в нем написано — это будет вполне подготовленное тестирование. Когда ты знаешь, что искать.

Подробнее — в другой части.

8. Глубина тестирования

Паттон пишет, что тесты, которые должны пройти успешно (Test-to-pass), должны проверяться в первую очередь. Если они не прошли, то остальные можно не проверять.

Меня не удивляет то, что это разбиение тестов почти нигде больше не упоминается. Причина — эта характеристика почти эквивалента разделению тестовых сценариев на позитивные и негативные. По сути, так оно и есть, кроме одного момента:

Tets-to-pass — это тесты в нормальном, наиболее часто используемом режим эксплуатации.

Test-to-fail — это тесты на неизведанной территории, которая может оказаться минными полем. Эти тесты вы не будете проводить после каждой сборки. Они нужны только для поиска особых состояний системы, в которых возможно возникновение ранее не обнаруженного дефекта или вообще сбой всей системы. Такие тесты могут быть ad hock, а негативные тесты — это могут быть случаи, которые проверяются при принятии баг фикса, и они должны пройти успешно.

Цель негативного теста — убедиться, что система правильно реагирует на неправильное действие. Цель test-to-fail наверняка сломать систему.

Помним, что чем раньше обнаружатся дефекты — тем лучше. И что к концу итерации система должна быть максимально проверена, а базовые сценарии должны наверняка проходить успешно. Таким образом, мы получаем чередование тестов по глубине.

Первая порция тестов должна позволить обнаружить некоторое количество show-stopper дефектов. Когда первая порция Test-To-Pass пройдет успешно, переходим ко второй — Test-To-Fail, которая должна выявить как можно большее количество дефектов всех степеней критичности. А после проведения последней порции тестов дефекты не должны возникнуть вообще — они должны быть снова Test-To-Pass.

9. Сценарии

Иначе вы упустите дефекты.

10. Динамичность

Если при тестировании происходят манипуляции с приложением — оно динамическое. Если состояние системы не меняется — это статическое тестирование. Статические тестирование часто упускается. Как можно тестировать, ничего не меняя? Ответ — на схеме. Code review и тестирование документации помогают выявить солидную долю ошибок, не тратя время на приведение системы в движение.

На этом просмотр в ширину закончен. Просмотр в глубину оставим на следующий раз.

Составление матрицы тестов

Вид требований
Объект тестирования
Знание системы
Степень автоматизации
Степень подготовленности тестов
Глубина тестирования
Время проведения тестирования
Степень изолированности компонентов
Динамичность

Говоря о конкретном проекте, можно будет разбить все объекты тестирования на функциональные и не функциональные группы, то есть по виду требований. — 1 измерение.

Браться за тот или иной набор тестов вы будете в зависимости от этапа разработки, поэтому тесты можно сгруппировать по времени проведения. Их можно пометить как тесты, которые должны пройти успешно, и как тесты, с помощью которых должны быть обнаружены дефекты. — 2 измерения

Проведения статических тестов можно заложить как стандартную практику на организационном уровне. Code review проводить после каждого commit с закрытием тикета, а тестировать спецификацию при получении новых требований или на стадии тест дизайна. — 1 измерение.

Ad hock / исследовательское тестирование проводить во время простоев в работе или в первые дни жизни проекта/нового функционала. Все остальные тесты считать подготовленными.

Вид требований * Объект тестирования = Функциональный компонент системы
Знание системы
Степень автоматизации
Степень изолированности компонентов

Теперь по ним можно составить матрицу возможных сочетаний видов тестирования.

Я тут посчитала, что даже по 4 характеристикам видов тестов получается так много, что нет смысла их генерировать.

Матрица, матрица… я считаю матрицей тестов этот самый майнд мап с видами тестов. Глядя на него просто надо держать в голове факт, что каждый отдельно взятый тест одновременно является разновидностью тестов всех перечисленных категорий верхнего уровня.

Заключение

Итак, множество тестов — огромно. Имея понимание цели проведения тестирования и систематизированное представление о видах тестов уже вполне можно ответить на вопрос — какие виды тестов вам нужны.

Какие функциональные и нефункциональные требования предъявлены к системе?
Из чего будет состоять система?
На сколько хорошо тестирующие знают строение системы?
Как и чем воспроизводить тестовые ситуации?
На каких участках и в каких масштабах будет тестироваться система?
На каком этапе разработки будут проводиться тесты?
Как вы будете описывать и хранить тесты?
Хорошо ли знают ваши тестировщики методы составления тестовых сценариев?
Будут ли разработчики проверять сами себя и друг друга?
Совершенна ли спецификация?

Надеюсь, я не запутала читателей еще сильнее, и вам моя матрица пригодится.

📎📎📎📎📎📎📎📎📎📎