Программа ''SAFA''


  • Программа SAFA (Semi-automated footprinting analysis) была разработана группой из Стендфордского Университета:
  • Статья авторов с описанием программы (R. DAS et al., 2005).

    Статья с алгоритмом расчёта нормализации (Takamoto et al. 2004a)

    Дистрибутив программы, образцы файлов сканов гелей и документацию можно скачать с их сайта, заполнив соответствующие формы анкеты.



  • Установка программы ''SAFA''



  • Порядок обработки сканов гелей


    0) общие особенности программы

    Выполнение действий каждой из кнопок происходит последовательно: пока не закончено одна операция, запускаемая нажатием кнопки из меню справа, другое действие не может быть запущено. Порядок операций - сверху вниз, кроме загрузки последовательности (может производиться на любом этапе). Однако в случае неудачного выполнения действия попытка приступить к нему повторно может привести к ошибкам. В таких случаях рекомендуется закрыть программу и начать обработку заново.

    Курсор в окне программы бывает двух типов: в виде стандартной стрелки и в виде перекрестья. Появление перекрестья показывает, что активирована функция, соответствующая данной кнопке программы из меню справа: обрезка изображения, отметка границ дорожек, выбор опорной дорожки и т.д. При выполнении некоторых функций возможно увеличение или уменьшение яркости видимого изображения путем нажатия клавиш 1 и 2, а также переключение между представлениями изображения в виде градаций серого и "шкалой высот" (последнее представление более наглядно проявляет контраст) с помощью клавиши C. Клавиши E и R стирают неверно проведенную полосу. Список возможных на данном этапе действий отображается над окном программы.

    02_1.jpg 02_2.jpg 02_3.jpg

    1) загрузка геля (кнопка Load Gel)

    Под "гелем" понимается графическое изображение в формате .tif (без сжатия, 16 бит), у которого расширение .tif заменено на .gel Размер и разрешение большого значения не имеют. В случае проблем с открытием собственного .gel файла рекомендуется проделать следующую процедуру.

    Решение нашлось простое. В Фотошопе (графический редактор Adobe Photoshop) открыл обрабатываемый гель и файл default.tif (получаемого из поставляемый в качестве примера и заведомо работающего файла default.gel путем простой смены расширения). Для этого надо копировать и посмотреть размеры и разрешение (Image size) области файла, который будет анализироваться (например, 3500х5800 pixels и разрешение 600 pixels/inch), сделать размеры default.tif файла такими же, и копировать в него свой файл. Далее у полученного изображения надо объединить слои и сохранить с нужным названием.

    После смены расширения .tif на .gel всё стало загружаться.

    После загрузки в программу изображение геля появляется растянутым на окно программы. Сразу после загрузки необходимо произвести обрезку ненужных для анализа частей изображения. При этом в окне программы появляется перекрестье, с помощью которого, последовательного нажав два раза левую кнопку мыши, необходимо построить прямоугольную рамку, внутри которой находится анализируемая область геля.

    Для корректного распознавания геля необходимо, чтобы изображение не было переэкспонировано.

    2) Определение дорожек (кнопка Define Lanes)

    Определяются границы дорожек, а также устранение поперечных деформаций дорожек.

    Перед началом определения дорожек требуется ввести величину дискретизации дорожек (number of bins per lane), то есть число областей, на которое будет разбита каждая из выбранных дорожек. По умолчанию предлагается величина 10 (которой не достаточно для гелей высокого качества); для гелей с искаженными полосами рекомендуются величины 50 или 100, что отразится на дальнейших временах обработки.

    В ходе собственно определения границ дорожек:

    1) левой кнопкой мыши устанавливается начало крайней левой дорожки на верхней границе изображения;

    2) левой кнопкой мыши последовательно установить точки на границе крайней дорожки, в результате чего формируется ломаная, ограничивающая дорожку слева;

    3) правой кнопкой мыши установить последнюю точку ломаной на нижнюю границу изображения;

    4) проделать пп 1)-3) для правой границы крайнего левой дорожки;

     (Фиг. 03_1).

    5) программа рассматривает правую границу одной дорожки как левую границу другой; в случаях тесного расположения дорожек целесообразно использовать клавишу G, после нажатия которой программа автоматически определяет следующую границу. Напротив, в случаях, когда треки разделяет большие расстояния или между обрабатываемыми дорожками расположены ненужные, удобно отмечать каждую необходимую дорожку в отдельности и уже после получения результатов исключить ненужные (напр., в Excel):

     (Фиг. 03_2)

    6) после определения всех границ и нажатия клавиши Q или Z программа проведет посреди каждой дорожки её середину.

    Между проведениями линий можно растянуть изображение по горизонтальной оси для удобства проведения границ данной дорожки правой клавишей мыши:

     (Фиг. 03_3).

     (Фиг. 03_4).

    3) Определение дорожки привязки (кнопка Anchor Lane)

    Определяется дорожка, по которой будет осуществляться выравнивание остальных дорожек. Требуется просто нажать крестообразным курсором на дорожку, к которой будет производиться привязка. Рекомендуется выбирать дорожку с известной последовательностью полос:

     (Фиг. 04).

    4) Выравнивание геля (кнопка Align Gel)

     (Фиг.05_1).

    При нажатии на кнопку появляется возможность исправления продольных (горизонтальных) искривлений геля. В той же последовательности, как и в пп 1)-3) при определении треков, необходимо провести несколько линий через соответствующие друг другу полосы на каждой дорожке. Чем больше проведено линий - тем лучше происходит выравнивание:

     (Фиг.05_2).

    Между проведениями отдельных линий возможно использование правой клавиши мыши для растягивания по вертикали ближайшей к курсору области геля, что облегчает проведение линии через середины полос. Повторное нажатие правой кнопки возвращает полное изображение геля.

    Выравнивание происходит после нажатия клавиши Q. После этого возможно повторное проведение линий и новое выравнивание. Окончательное выравнивание и переход к следующему этапу осуществляется нажатием клавиши Z.

    5) Загрузка последовательности из файла (кнопка Loading Sequence)

    Последовательность представляется в виде файла формата .fas, являющегося текстовым файлом .txt из двух строк с изменённым расширением. В первой строке после символа > содержится описание последовательности. Во второй строке содержится сплошной набор символов A, T, G, C, соответствующих остаткам азотистых оснований.

    После загрузки файла в появившемся окне необходимо галочками отметить основание (основания), по которым происходит разрезание - после этого эти основания в последовательности отмечаются соответствующими цветами. Постановка галочки в окно Three-Prime приводит к тому, что расстановка соответствия полос происходит с последнего основания к первому. Это соответствует наличию метки на 5' или на 3'-конце (Фиг.01).

    После нажатия кнопки Ok окно не закрывается, а лишь "бледнеет".

    6) Определение дорожек (кнопка Assign Bands)

    Перед определением расщепления требуется ввести номер полосы нуклеотида, с которого начинается отсчёт. После этого на открывшемся изображении геля с помощью крестообразного курсора необходимо отметить полосы на треке известной последовательности, которые соответствуют местам расщепления. Номера отмечаемых полос последовательно обозначаются над окном программы. Прочие основания (по которым в опорном треке не произошло расщепление) расставляются автоматически, и в случае грамотного выравнивания и отсутствия ошибок в последовательности приходятся на соответствующие дорожки остальных треков. Отметка осуществляется при нажатии левой кнопки мыши, при этом через все полосы, соответствующие данной полосе известной дорожки, проводится цветная полоса с указанием типа остатка и его номера в последовательности из файла .fas ; правой кнопкой можно растягивать необходимые участки для более точного позиционирования курсора на середине полосы. Клавишами E и R стирается только последняя полоса.

     (Фиг.06).

    7) Измерение геля (кнопка Quantify)

    Оптимизация представляет собой оптимизацию Levenberg-Marquardt методом наименьших квадратов относительно суммы Лоренцовых кривых. Перед началом оптимизации требуется ввести число полос на геле (начиная с нижней), которые считаются ясно различимыми: это число не может быть больше числа, предлагаемого программой. Положение этих первых полос будет оптимизировано (для остальных программа оставляет оценку пользователя).

    После оптимизации на экран программа выводит окно Фигуры 2 и задаёт вопрос, желает ли Пользователь обработать все треки или обрабатывать их по одной.

    На каждой из Фигур содержится три рамки. В верхней рамке отображаются: экспериментальные точки (синие точки), отдельные Лоренцевы кривые профиля дорожек ( красные колоколообразные кривые), и сумма всех Лоренцевых кривых как среднеквадратическое приближение для экспериментальных данных (зелёная кривая). В средней рамке отображены площади подогнанных кривых (чёрным - для первых, "лучших" полос, синим - для площадей всех полос). В нижней рамке подогнанный профиль ( синяя кривая) и данные (зелёная кривая).

     (Фиг.07).

    После завершения обработки программа задаёт вопрос, нужно ли сохранять данные. Данные обработки сохраняются в виде текстового файла .txt, в котором по строкам расположены дорожки треков, а по столбцам: 1) номер дорожки в файле; 2 и т.д.) площадь под Лоренцевой кривой для данной дорожки. Отрицательные площади могут получаться в случаях, когда в указанном положении отсутствует полоса.

    Из текстового формата возможен экспорт данных в книгу MS Excel (формат .xls) путём копирования содержимого файла и вставки его в область листа книги Excel с числом столбцов, равным числу столбцов текстового файла.

    После сохранения результатов на экран выводится Фигура 3, (Фиг. 08) содержащая первую рамку Фигуры 2 для N-го числа треков (число N запрашивается непосредственно после сохранения результатов). Этот формат удобен для распечатывания форм кривых или сохранения их в формате .pdf.Для номеров треков, превышающих N, построение фигуры возможно, если выбрать в главном окне программы Visualize Data > Plot Fits.

     (Фиг.08).

    А. Нормализация данных (утилита NormPlot)

    Для нормализации данных можно использовать утилиту нормализации NormPlot. Запуск её: Visualize Data > Normalization/Colorplot.

    Применение утилиты целесообразно в случаях, когда сравниваются относительные интенсивности полос в разных треках. В основе принципа нормализации лежит определение инвариантных частей (треков или полос), и на основе этих частей производится нормализация остальных данных. Подробнее принципы нормализации изложены в работе [Takamoto, Chance, and Brenowitz (2004), Nucleic Acids Res. 32(15):E119].

    В окне утилиты красным цветом отмечены дорожки, соответствующие большей величине, синим - соответствующие меньшей величине (Фиг.09_1).

     (Фиг.09_1).

    1) Вначале необходимо исключить треки, не участвующие в дальнейшей нормализации. Для этого надо последовательно отмечать ненужный трек левой клавишей мыши и затем нажимать клавишу D.

    2) Данные могут быть нормализованы на значения одного или более треков, например, на значение трека в отсутствие белка. Для этого надо отметить тот трек, на который происходит нормализация, левой клавишей мыши, а затем нажать клавишу N. После этого интенсивности красного и синего будут отсчитываться от соответствующих значений нормировочного трека. Сам нормировочный трек, разумеется, станет белым. Над окном утилиты, над нормировочным треком, при этом появится символ N (Фиг.09_2).

     (Фиг.09_2).

    После завершения нормализации необходимо нажать Q или Z , после чего возможно сохранение копии изображения в окне утилиты в форматах ..pdf , .tif , .ai

    Нормализация параллельно полосам. При этом программа автоматически находит инвариантные остатки и отмечает их символом X на вертикальной оси справа от окна. По полосам, соответствующим этим основаниям, утилита производит нормализацию. Добавление или исключение отдельных оснований осуществляется клавишами I и 0. В конце пользователь может установить окончательное состояние, подведя крестообразный курсор к нужному треку и нажа в F. Это устанавливает окончательные величины полос в этом треке и линейно преобразует остальные данные.

    Загрузка предыдущих данных из текстового файла осуществляется в File > Read Data. Для сброса данных используется File > Latest SAFA data.

    Данные нормировки можно сохранить в текстовый файл с расширением .norm.txt .

    Б. Отображение данных в виде вторичной структуры

    Дополнительные функции

    - Для очистки памяти программы можно использовать File menu > Reset Application

    - После выравнивания гель может быть сохранён в формате .tif с помощью выбора File menu > Export Gel Функция значительно облегчает работу при многократной обработке одного изображения. -

    Нет описания:

    1) утилиты построения вторичной структуры НК (там надо загружать вторичную структуру из внешнего файла). Может при случае разберусь;

    2) среднеквадратичного изображения геля (пробовал снимать галку на Settings > Render SQRT Image, но какой смысл в этом среднем квадрате - не понял. Собственно, всё и без этого понимания нормально работает.


    Замечания:

    Программа не любит, когда её сворачивают и работают в других приложениях: часто после этого она зависает. Также программа зависает после нажатия клавиши Ввод (Enter) на клавиатуре, а также иногда клавиш функционального ряда.



    (Страница создана - 29.11.2006)

    o Последняя модификация 18.11.2014