Что такое облачный сервис и как им пользоваться
Облачное хранилище что это: инструкция для новичков
Облачное хранилище, что же это такое? Это онлайн-сервис, позволяющий пользователям хранить информацию в сети на серверах. Благодаря им можно освободить место на смартфонах, персональных компьютерах.
Изучив данную статью, вы сможете выбрать для себя лучшее облачное хранилище, узнаете о плюсах и минусах каждого из них.
Облачное хранилище – что это такое?
Если говорить простыми словами, то принцип работы любого облачного хранилища данных заключается в следующем: на ноутбук, ПК или любой другой гаджет устанавливается специальная программа, в которую можно перенести информацию из папок, содержащихся на устройстве.
В дальнейшем она сама будет отслеживать изменения в них и автоматически загружать новые файлы в облако. Связав хранилище со всеми вашими устройствами, вы получите доступ ко всей информации с любого гаджета. Единственное условие, необходимое для слаженной и четкой работы облака – полная синхронизация.
Преимущества хранения информации в облаке
Облачные хранилища – удобный и современный способ хранения информации. Вот их основные достоинства:
Экономия места на гаджетах и сторонних носителях
Вам не понадобится носить с собой кучу жестких дисков и проводов, все данные будут автоматически доступны с любого вашего устройства.
Обслуживание облачных хранилищ осуществляется опытными инженерами. Они регулярно производят обновление системы, улучшают ПО, стараются обеспечить максимальную стабильность работы.
Обеспечивается ЦОД – это специальное здание, которое охраняется в круглосуточном режиме и снабжено современной системой контроля доступа и видеонаблюдением. Внутри установлено оборудование для автоматического охлаждения техники, системы пожаротушения и резервного питания на случай отключения электроэнергии.
Безопасность при передаче данных
Гарантирована благодаря жестким настройкам прав доступа к учетным записям, шифрованием информации при ее загрузке, чтении и редактировании.
Управлять всем данными возможно через консоль, API и графические интерфейсы.
Недостатки
Помимо достаточно весомого числа плюсов, есть у облачных хранилищ и ряд минусов:
Необходим постоянный, быстрый и качественный интернет
Если соединения с сетью не будет, то получить доступ к файлам не получится. Поэтому, если планируете работать с облачными хранилищами, то заранее позаботьтесь о стабильном интернете.
Информация в облаке может загружаться достаточно медленно, это связано, как правило, с большими ее объемами.
Безопасность файлов не всегда обеспечивается на все 100%
Загружая свои данные в сеть, нельзя исключать возможности их воровства. Однако таких инцидентов практически не происходит благодаря хорошему шифрованию современных сервисов.
Возможность безвозвратной потери данных
Такое случается при полном крахе системы, что маловероятно, но все же может произойти.
Для чего применяются облачные хранилища?
Прежде чем разбиться в том, как пользоваться облаком, нужно понять, для чего же оно предназначено.
Основные цели применения облачных хранилищ данных:
Разновидности
Какие бывают облачные хранилища? Выделяют 3 типа: объектное, блочное и файловое. Далее будет более подробно рассмотрен каждый вид.
1. Блочное
Здесь весь объем информации делится на равные части – блоки, каждый из которых обладает собственным идентификатором.
Главным преимуществом блочных облачных хранилищ является то, что все клиентские среды разделены, благодаря чему к каждой из них можно получить отдельный, быстрый доступ.
2. Файловое
Организация хранения в таком типе облака проста даже для чайников. Информация представляет собой определенные файлы, который объединяются в папки, а они в свою очередь в подкаталоги и каталоги, то есть данные хранятся в иерархической системе.
Главное преимущество такого облака – интуитивно понятный интерфейс и простота использования. В нем легко ориентироваться даже начинающим пользователям.
Недостаток: данный тип облачного хранилища плохо масштабируется, а потому с увеличением количества информации иерархия сильно усложняется и замедляет работу системы.
3. Объектное
Это наиболее современный и универсальный способ хранения большого объема информации. Его можно использовать для данных абсолютно любого типа. Это может медиа-контент, программы, бухгалтерская и статистическая отчетность и так далее.
Главным недостатком такого облака является то, что у пользователя нет возможности просто перетащить файл в нужную папку. Чтобы загрузить информацию придется воспользоваться специальным программным интерфейсом – API.
Создание облачного хранилища
В данной статье рассмотрены основные облачные хранилища данных, наиболее распространенные среди пользователей. Их легко можно создать на андроид и устройствах с любой другой операционной системой.
Занимает первое по популярности место. Сервис позволяет пользователям использовать бесплатно до 10 Гб памяти. Наиболее тяжелый файл не должен весить более 2 Гб.
Бесплатный тариф – 7 Гб. Максимальный файл до 5 Гб.
Занимает почетное третье место в рейтинге. При этом дает клиентам в пользование 15 Гб бесплатной памяти. Величина разовой загрузки составляет не более 10 Гб.
Предоставляет пользователям бесплатно максимальный объем памяти. Вы получите в доступ целых 50 Гб, при этом за раз можно будет загрузить не более 10 Гб информации.
Бесплатно можно использовать до 25 Гб памяти, величина однократной загрузки не может превышать 2 Гб.
Внимание! Получить дополнительное свободное место в любом, из представленных выше, облаке возможно двумя путями: участвовать в розыгрышах и акциях или просто купить гигабайты.
Прежде чем приступить к созданию хранилища, необходимо выбрать сервис. Инструкция достаточно простая и не должна вызвать затруднений, однако у каждого облака есть индивидуальные особенности и ряд нюансов.
Яндекс.Диск
Чтобы создать такое облако достаточно выполнить ряд несложных действий:
Если 10 бесплатных Гб вам покажется мало, то можно за 99 рублей в месяц или 990 рублей в год оформить подписку на целых 100 Гб памяти. К тому же у этого сервиса есть одно существенное достоинство. В нем установлена антивирусная система Dr.Web, проверяющая все загруженные и скачанные файлы.
Благодаря такому усовершенствованию вы можете не переживать за работоспособность и «здоровье» своего компьютера. Яндекс.Диск полностью прописан на русском языке, что также является огромным плюсом.
Пошаговый алгоритм создания облака от гугл:
Внимание! Платный тариф на Гугл предполагает использование 100 Гб памяти. Стоит такой объем 139 рублей в месяц. Если оплачивать сразу годовую подписку, то она обойдется в 1 390 рублей.
При необходимости можно разрешить другим пользователям не только просматривать ваши файлы, но и редактировать их. Такая функция может быть очень полезна при создании коллективных проектов.
При этом данный сервис не очень подходит для хранения фотографий и видеозаписей, что для ряда пользователей может стать существенным недостатком.
Microsoft OneDrive
Алгоритм для начала работы с хранилищем:
Важно! Принцип, на котором основана синхронизация, зависит от операционной системы вашего устройства. Поэтому перед началом работы с хранилищем необходимо скачать подходящий вариант программы для его адаптации.
Создание облачного хранилища на Мега:
Mail.ru
В последнее время многие пользователи отдают предпочтение именно этому облачному хранилищу, ориентируясь на его надежность и достаточно большой объем бесплатного пакета.
Создать облако на Mail.ru можно по следующему алгоритму:
В облаке на Mail.ru можно бесплатно хранить любую текстовую и медийную информации в объеме до 25 Гб. Память можно расширить до 64 Гб, если вы готовы платить за нее 75 рублей ежемесячно.
Коротко о главном
Теперь вы знаете, что такое облачные хранилища данных.
Они стали весьма популярны, особенно среди тех пользователей, кто активно занимается фотографией, снимает большое количество видеороликов или работает с большим количеством текстовых файлов.
Онлайн-хранилищ существует в настоящее время очень много, но суть у них одна. Они помогают работать с огромным объемом информации и экономить место на устройствах.
Облако — что это и зачем?
Недавно мы запустили сервис ABBYY Cloud OCR SDK, работающий на облаке Windows Azure и попутно набрали 100500 опыта. Например, узнали, что многие используют слово «облако» и слышали, что «облака – это модно», но очень немногие понимают, что такое облако и главное – зачем делать сервис именно в облаке. Слово «облако» повсеместно используется и, похоже, начало обрастать городскими легендами.
Посмотрите, например, вот это видео:
Не много потеряете, если просто сосредоточитесь на том, что блондинка хорошо выглядит и у нее приятный голос.
Рассмотрим подробно, что такое публичное облако, зачем может иметь смысл использовать его для работы ПО и правда ли, что «скоро все будет в облаках».
Невиданные возможности для ваших клиентов
Для начала – чем для клиента сервис «в облаке» отличается от сервиса «не в облаке».
Считается, что «облачный» сервис обладает уникальным свойством – доступностью для любых пользователей. Облака тут ни при чем. Наш сервис работает в облаке, выглядит для пользователя как обычный веб-сайт (часть запросов даже выдает обычные на вид веб-страницы), в нем, например, есть пользовательский кабинет, который выглядит как обычные веб-страницы.
Для сравнения посмотрите на Stack Exchange (наиболее известен благодаря сайту Stack Overflow) или Яндекс.Почту – они для пользователя выглядят точно так же. Они тоже доступны любым пользователям и откуда угодно. Там тоже веб-сервер, который тоже принимает запросы по HTTP, там тоже все равно, какая операционная система у клиента, какая архитектура у его машины, на каком языке написаны его программы.
Можно встретить утверждения, что благодаря облачности сервиса «данные пользователей доступны им откуда угодно». Да, пользователи сервиса могут закачивать изображения на наш сервис откуда угодно и получать результаты тоже откуда угодно. Кстати, пользователи Stack Exchange или Яндекс.Почты тоже могут работать с этими сервисами откуда угодно – задавать вопросы, получать ответы, отправлять и получать письма.
Функционально облачный сервис не отличается для пользователя ничем. Что в облаке, что не в облаке, на каком-то IP-адресе стоит сервер (обычно веб-сервер), который принимает и обрабатывает запросы. Если нет настроек, ограничивающих доступ к серверу с конкретных диапазонов IP-адресов и клиент сам не сидит за параноидальным фаерволом, то сервис доступен откуда угодно и с какого угодно устройства. Облачность тут никак не сказывается.
Облачные сервисы для облачных сервисов
Также считается, что сервис в облаке делают для того, чтобы с ним могли взаимодействовать другие сервисы в облаке – что-то из серии «для использования разработчиками облачных сервисов», как недавно написали авторы одного пресс-релиза. В особо бредовых презентациях можно встретить картинки с утыканным колышками наивно схематичным облаком – это облако, в нем сервисы, и они там взаимодействуют.
Посмотрим на это с точки зрения нашего сервиса. Цель разработки нашего сервиса – предоставить программно доступный из любой точки мира сервис – чтобы сторонние разработчики, которым в их программах не хватает оптического распознавания текста, могли разработать ПО, которое использует наш сервис для распознавания. Например, программу для смартфона, которая фотографирует чек, извлекает из него данные и сохраняет их в программу для бюджетирования на том же смартфоне. Капитан Очевидность подсказывает: смартфон не в облаке. Наш сервис не только для «разработчиков облачных сервисов», он для разработчиков любых программ, которые готовы использовать сторонний сервис для распознавания текста. В облаке те программы работают или нет – не имеет принципиального значения, а нашему сервису просто все равно.
Считается, что облачный сервис – это обязательно сервис для обслуживания многочисленных внешних запросов. Обычно да, но не обязательно. Никто не мешает вам запустить на вашем сервисе разложение простых чисел на множители, исходные данные для него хранить где-нибудь снаружи, чтобы сервис их сам оттуда брал, а результаты заливал на внешний ftp-сервер.
Облачная архитектура облачных сервисов
Далее – считается, что сервис, работающий в облаке, принципиально по-другому устроен, его разработка требует принципиально другой архитектуры по сравнению с сервисом, работающим не в облаке. Некоторые отличия действительно есть, но они второстепенны.
Представьте, что вам нужно сделать веб-сервис, который принимает от пользователя изображения, складывает их в очередь на обработку (потому что распознавание занимает некоторое время), обрабатывает, после обработки дает пользователю ссылку на скачивание результата. Как бы вы сделали его? Скорее всего, вы бы создавали во внутреннем хранилище (скорее всего, базе данных) «задание» для каждого принятого изображения, давали ему уникальный идентификатор, отдельным потоком или отдельным процессом распознавали изображение, потом на очередной запрос «как дела у задания такого-то» возвращали ссылку на результат. Это совершенно очевидная архитектура для такого сервиса, и облачность тут тоже ни при чем.
Считается, что в облаке используется «облачная операционная система». Обычно это просто допиленная «обычная операционная система». В Windows Azure это Windows Server 2008 R2 со слегка перетянутыми гайками (например, временная папка очень маленькая). Вся «облачность» в такой среде создается дополнительными сервисами – например, долговременным хранилищем данных, не привязанным к машине, на которой работает пользовательский сервис.
Некоторое время назад мы рассказывали, что теперь FineReader Engine поддерживает работу в Windows Azure. Эта доработка не потребовала полного переписывания всего FRE, просто учли ограничения платформы, немного под них доработали, протестировали, обновили документацию, взяли на себя обязательство дальше поддерживать. Кропотливая и важная работа, но не более того.
Беспрецедентная надежность
Еще считается, что облачный сервис непременно более надежен, потому что там же есть облачный провайдер облачного облака, предлагающий много девяток после запятой. Тут девятки отдельно, надежность отдельно.
Прежде всего, нужно читать мелкий шрифт в соглашении о девятках (SLA – Service Level Agreement). Там указано точно, что эти девятки означают, какие конкретно свойства сервиса они затрагивают, какова ответственность провайдера.
Обычно ответственность провайдера не больше, чем те относительно небольшие деньги, которые вы ему заплатили, а пока ваш сервис не работает, ваша компания может терять гораздо большие деньги и нести ущерб репутации. Да, провайдер ответит, но вам от этого может не полегчать.
Похожий пример из жизни: в среднем раз в год в здании на секунду отключается электроснабжение, так что перезагружаются компьютеры. С точки зрения поставщика электроэнергии – это жалкая секунда в год (сколько там девяток?), а с вашей точки зрения – это потеря нескольких минут работы каждым сотрудником, потому что ему нужно будет ждать, пока загрузится ОС, запустятся все программы, потом вспоминать, на чем он остановился. Девяток много, а вам от этого не легче.
Соглашение может гарантировать доступность каких-то конкретных сервисов (например, что виртуальные машины, на которых работает ваше ПО, будут работать и подключены к сети) – может возникнуть ситуация, когда надолго откажет, например, второстепенный с виду сервис управления этими виртуальными машинами – они будут продолжать работать, а запустить новые или перенастроить их вы не сможете. Вам-то как раз надо было увеличить пропускную способность сервиса в сто раз, чтобы принять пиковую нагрузку от очень важной и щедро оплаченной только что начавшейся рекламной кампании. Провайдер даже соглашение не нарушил, потому что в соглашении об этом второстепенном на вид сервисе ничего не говорится.
От размещения в облаке сервис не становится гарантированно более или менее надежным. Риски никто не отменяет, просто риски становятся другими.
Так что это?
Теперь, когда мракобесия стало меньше, вернемся к вопросу, что такое публичное облако. Это сервис с дистанционным управлением, который предоставляет вам вычислительные мощности и хранилища данных с оплатой по мере использования. Вы используете мощности для работы вашего ПО (вашего сервиса), а хранилища – для хранения данных, с которыми это ПО (ваш сервис) работает.
У вас может быть разный уровень контроля над предоставляемыми мощностями. Например, вам могут выделить виртуальную машину с конкретной ОС и закрепить ее за вами и дать вам к ней удаленный доступ, чтобы вы сами настроили ее как вам нужно и дальше оставить ее в вашем распоряжении. Или (как в Windows Azure) вы можете загрузить специальный архив с исполняемым кодом вашего сервиса и конфигурационный файл, в котором указано «запустить вот это на 5 машинах по 2 ядра каждая», служебная инфраструктура облака сама найдет подходящие виртуальные машины, развернет, запустит и настроит на них ОС, потом развернет там ваш архив и передаст управление в точку входа (фиксированная функция типа main()), и будет следить, не сломалось ли что, в случае чего перезапустит ваш сервис на той же или (при сбое машины) на другой машине. В первом случае вы больше контролируете, во втором у вас больше дополнительных плюшек.
В чем прибыль?
Прибыль в гибкости и делегировании обязанностей. Вам нужно увеличить число машин, на которых работает ваш сервис? Несколько щелчков мышью, ожидание в районе 10 минут – и вам уже нашли новые виртуальные машины, запустили на них ваш сервис. Надо убавить? То же самое.
То же самое с хранилищем. Нужно хранилище – несколько щелчков мышью, и вам его предоставили и дали адрес и ключи доступа к нему. Хранилище обычно резиновое, оплата зависит от реально используемого объема.
Провайдер может, например, предоставлять сервер баз данных – тоже «где-то» и тоже с оплатой по используемому объему. В Windows Azure это SQL Azure, основанный на специально настроенном и допиленном SQL Server 2008.
Нужно попробовать новую фичу и есть риск сломать сервис? Можно сделать так. Создаете еще одно хранилище и еще одну базу данных. Настраиваете ваш сервис на новое хранилище и новую базу, разворачиваете на дополнительно выделенных виртуальных машинах. Попробовали, освободили машины, если в хранилище и базе много данных, можно их тоже удалить, чтобы не платить за них.
У нас автоматическая сборка в конце разворачивает наш сервис прямо в облако на специально выделяемую для этого виртуальную машину и выполняет там тесты. При каждой сборке машина выделяется заново, после сборки освобождается, так что в выходные и ночью, когда правок кода нет, мы за нее не платим. Код тестируется в точно таком же окружении, в каком он будет потом работать.
Такая гибкость очень удобна. Это светлая сторона облака, за которую оно в первую очередь и ценно. Надо – берете в аренду, не надо – прекращаете аренду, и то, и другое требует нескольких щелчков мышью (или программного запроса) и не очень долгого ожидания.
Это удобно для компании любого размера. Не надо проводить через бухгалтерию закупку каждой железки, не надо закупать оборудование про запас, можно добиться гораздо меньшего простоя мощностей и гораздо большей гибкости в управлении.
Плюс вы перекладываете часть обязанностей на провайдера. Сервера вы больше не покупаете, стойки не собираете, электрическим подключением не занимаетесь, место под оборудование вам не нужно, вы можете даже ОС не настраивать (зависит от облака). Обратите внимание, речь именно о перекладывании обязанностей, но не ответственности, об этом подробнее ниже.
Как обычно, есть и темная сторона
Темная сторона облака в том, что на многие вещи нельзя повлиять. Если верить блогу команды Stack Exchange, их сервис работает не в облаке, а на собственном оборудовании, именно потому, что их не устраивает уровень контроля, который предоставляется провайдерами облаков.
Например, виртуальные машины стандартные и вы можете даже не знать характеристик реального железа. Скорее всего, когда в Windows Azure вы разворачиваете сервис на одном одноядерном узле, вам на самом деле дают виртуальную машину, которая работает в каком-нибудь 16-ядерном сервере под HyperV. Может быть, можно там что-нибудь подкрутить и на ровном месте получить 15-процентный прирост производительности, но вы ничего не можете с этим сделать.
Если вы параноик или связаны жесткими требованиями закона или договора, вас может не устраивать, что вы вообще очень мало контролируете железо. Например, вы закачали туда документы с коммерческой тайной, они скопировались на кучу жестких дисков, вы никак не можете повлиять на их гарантированное удаление. Да, провайдер вам обещает, но вы не сможете это проверить.
То же самое касается надежности. Вы не можете быть уверены, что стойки в один прекрасный момент, например, не зальет конденсатом из оторвавшейся трубки системы кондиционирования. Если бы ваш сервер был в офисе или в colocation, то вы могли бы сделать что-нибудь, пусть даже на вид безумное, типа отвода воды из пространства над вашим оборудованием. Здесь вы ничего сделать не сможете – вы не контролируете, где стоит оборудование, хорошо ли оно там закреплено и не бегают ли по нему мыши. Все безумные события, которые вы могли бы предусмотреть (или не предусмотреть и чувствовать угрызения по поводу плохо сделанной работы), теперь полностью вне вашего контроля.
Безумные события бывают самые разные. Вот примеры реальных сбоев в датацентрах.
FAIL. Автомобиль врезался в опору ЛЭП рядом с датацентром, оборвались и упали на землю провода высокого напряжения перед подстанцией, питающей датацентр. Начался переход на резервное питание. От проводов, лежавших на земле, ток стекал в землю, в датацентре защитные схемы среагировали на утечку тока в землю и отключили весь датацентр.
Другой FAIL. Предположительно из-за удара молнии вышел из строя трансформатор, питающий датацентр, начался переход на резервное питание. По какой-то причине не удалось синхронизировать генераторы (скорее всего, не было питания на оборудовании, выполняющем синхронизацию), датацентр не смог перейти на резервное питание, все оборудование отключилось.
Обратите внимание, мы знаем об этих случаях потому, что они затронули сотни и тысячи пользователей облаков. Сколько аналогичных событий происходит с серверами, стоящими в офисах, мы просто не знаем.
Конечно, что-то подобное может произойти и с серверами в офисе, но в таком случае в этом будет доля вашей вины – могли предусмотреть, а не предусмотрели. Вам будет стыдно за плохо сделанную работу. В случае, когда оборудование стоит «где-то там», таких возможностей нет, вы вынуждены верить провайдеру.
Это не плохо, просто нужно это четко понимать. Размещая сервис в облаке, вы передаете провайдеру значительную часть обязанностей, но не ответственность за жизнеспособность вашего сервиса. Облачный не значит автоматически более надежный и не значит автоматически менее надежный. Вам все равно нужна оценка рисков, для критически важных сервисов понадобится дублирование в разных датацентрах и перераспределение нагрузки. Очень может случиться, что когда вы учтете все расходы на дублирование и синхронизацию данных между датацентрами, ценник вас расстроит.
Снова облачная архитектура облачных сервисов
Напоследок – об особых требованиях к облачным сервисам. Такие требования есть – нужно быть готовым, что в любой момент что угодно может сломаться. Если вы любите крайности, то можете как Netflix сделать сервис, который в произвольные моменты ломает что-нибудь в вашем сервисе. Особенно нужно быть готовым к эпизодическим кратковременным сбоям. Например, иногда будет ненадолго пропадать связь с SQL Azure – ваш код должен не паниковать и не ломаться, а подождать немного и попробовать еще раз.
Просто вспомните, что обычно раздражает пользователей в программах – всевозможные «не удалось найти сервер, вот 18 пунктов, которые стоит проверить» в распределенной системе абсолютно нормальны, ваш сервис должен пробовать сам с этим справиться, потом пробовать еще несколько раз. Пользователь после сообщения браузера «нет ответа сервера» обычно нажимает F5, так и ваш сервис должен просто попробовать повторить действие. Для этого важно, чтобы повторное выполнение любого действия не наносило вреда – это называется умным словом идемпотентность. Если вы не учтете эту особенность, то ваш сервис будет в самый неподходящий момент выходить из строя из-за какой-нибудь ерунды.
Аналогично сервис должен быть готов к тому, что его могут в любой момент остановить – на всех узлах или на некоторых – и затем запустить снова, при этом не должно происходить повреждения данных, потеря самых новых данных должна быть минимальной, после перезапуска сервис должен быть в состоянии продолжить работу как будто ничего не произошло. Такое происходит, например, при автоматической установке обновлений ПО в Windows Azure – узлы по очереди останавливаются, затем сервис запускается на узле с уже обновленным ПО.
Требования существенные, но выполнимые, просто Мерфи будет чаще приходить к вашему сервису. От вас зависит, превратится ли небольшой FAIL в былинный отказ.
Облако – это не куча слов «масштабируемое», «доступность», «миграция», «производительность», «тенденция», употребленных в произвольном порядке в маркетинговом тексте. Это просто модель владения вычислительными мощностями. В определенных случаях эта модель очень удобна.
Кстати, у нас есть сервис для разработчиков, работающий в облаке.
Дмитрий Мещеряков,
департамент продуктов для разработчиков