Я отлично помню презентацию Apple, когда Стив Джобс показал iPhone 4 в 2010 году. На ней впервые представили экран Retina. По-английски ретина — это сетчатка. И Стив Джобс говорил, что они сделали в дисплее ровно столько пикселей, сколько нужно глазу, чтобы не замечать их. Тогда это было 326 пикселей на дюйм или 326 ppi.

Но как, как они посчитали, откуда они знают, сколько пикселей нужно глазу, думал я.

И несмотря на то, что Retina от Apple — это конечно сплошной маркетинг. Позже они не раз меняли это разрешение появилась Retina HD, Super Retina HD, Liquid Retina и даже Retina 4K — глаза-то оставались прежними. Посчитать разрешение глаза все-таки можно, хоть это не так просто! И сегодня мы этим займемся.

Беглый запрос в Google: “Сколько мегапикселей в наших глазах” — даёт противоречивые оценки. От 120 мегапикселей до 576 мегапикселей. А что если я скажу вам, что наш глаз снимает “фотографии” качество которых, потянет на несколько мегапикселей? И по факту, всё что мы видим, это во многом плод нашего воображения! Можно даже сказать, что разрешение человеческого глаза — всего 1 мегапиксель…

Но зачем же тогда нам фотографические матрицы разрешением 200 мегапикселей и 8K-дисплеи? Какие ещё тайны скрывают наши глаза? И как гаджеты используют это?

Сегодня, научный подход! Мы с вами изучим как устроены наши глаза. Выясним какое разрешение и сколько мегапикселей в них.

Устройство камеры

Итак, прежде всего, устройство глаза очень похоже на цифровую камеру.

Давайте освежим нашу память. Как устроена камера в нашем смартфоне? Любая камера состоит из двух основных частей это: матрица и система линз.

Матрица состоит из пикселей. Чем больше матрица и пикселей в ней, тем качественнее получаются наши фотографии. Линзы в свою очередь фокусируют свет и направляют его матрицу. Всю полученную информацию процессор смартфона преобразует в изображение.

Устройство глаза

Теперь посмотрим на устройство глаза. Вот смотрите, в глазу есть такой элемент под названием сетчатка. Это матрица наших глаз. На фотографии она подкрашена серым цветом.

Аналог линзы называется хрусталик. Хрусталик может изменять свою форму за счет специальных мышц. Благодаря чему мы можем фокусироваться на разных объектах. Им мы улавливаем свет и проецируем его на нашу сетчатку.

Но сейчас нас больше интересует матрица, то есть сетчатка. Получается, раз у нас есть матрица, то и пиксели должны быть? Сейчас всё объясню!

Посмотрите на эту фотографию, это палочки rods и колбочки cones. Они находятся на сетчатке глаза и выполняют роль пикселей. Называются так по своей форме, по английски чуть более понятно: Rods, Cones — Стержни и Конусы. То есть, у нас в глазу два типа пикселей. Почему так?

Палочки, колбочки = пиксель

Палочки отвечают, в основном, за ночное зрение, в глазу здорового человека их от 115 до 120 миллионов штук! Их фишка в том, что они реагируют на яркость, не воспринимая цвет. Простыми словами, работают как ночное зрение. Зато они очень чувствительны: Для их активизации требуется совсем немного внешнего света. Чувствительность палочки достаточна, чтобы зарегистрировать попадание даже 2-3 фотонов, частиц света. Наши глаза в темноте прекрасно могут определять малейшее движение, силуэты.

Палочки, это пиксели которые не видят цветов и нужны нам в основном ночью.

Теперь второй тип пикселей. Вот колбочки отвечают за цветное изображение. Взглянем на нашу фотографию ещё раз, колбочки имеют в своём составе определённые пигменты, получается 3 типа цветных «пикселей»: красный, синий и зелёный. Колбочек в здоровом глазу находится порядка 7 миллионов штук и это почти в 17 раз меньше, чем палочек!

Более того, палочки и колбочки распределены не равномерно по нашей сетчатке, об этом чуть позже.

Теперь мы имеем представление что такое палочки и колбочки. Выходит, если сложить палочки и колбочку, получается около 127 миллионов рецепторов. Значит, в человеческом глазу 127 Мегапикселей, так?

Не совсем. Вернее даже, совсем не так. Давайте, копнём ещё глубже и посмотрим как они работают между собой. Есть еще один важный аспект.

Пиксели как в камере, так и в глазу, не работают по отдельности. Они собраны в группы.

В камерах эта технология называется биннинг пикселей. Обычно пиксели объединяются в группы по 4 или 9 штук. Получается один большой пиксель. Такой финт ушами нужен, чтобы постараться уловить больше света и максимально избавиться от шумов в фотографии.

Но надо оговориться, пиксели в камере всё равно считываются по отдельности. Их “объединение” в группы, происходит уже после считывания информации.

И запомним ещё один факт, каждый пиксель в камере подключён к матрице отдельно, своим проводом. То есть в камере у которой 10 мегапикселей, 10 миллионов пикселей и 10 миллионов проводов.

У наших глаз тоже есть свой “биннинг” пикселей! Только в отличие от смартфонов, палочки и колбочки объединяются в группы по десятки, сотни, а то и тысячи штук!
Если в камере, каждый пиксель подлючён одним проводом, то у нас в глазах одним проводом подключены целые группы рецепторов. Такие контакты называются ганглионарной клеткой.

Причем палочки, чаще объединяются в такие группы чем колбочки. Их банально больше. Но почему так, поговорим чуть дальше.

То есть, выходит, что мозг напрямую получает информацию не от всех 127 миллионов, а уже от объединненых в группу пикселей. Сколько же их? Физически, у человека в среднем 1 миллион таких проводов или пучков в глазу.

Напомню что, 1 мегапиксель, это 1 миллион пикселей. То есть, по этой логике, наш глаз, в среднем видит в разрешении 1 мегапиксель. Просто больше он не может, из-за недостатка “проводов” в глазах?

Но что-то не сходится. 1 Мп — это примерно разрешение HD-монитора 1280 на 720. Если вывести наше видео в таком качестве на большом мониторе, вы легко увидите зерно. С этим подходом явно что-то не так. Мы видим мир явно более четко. В чем прикол?

И тут надо посмотреть на главный лайфхак в строении сетчатки. Помните, я говорил про неравномерное распределение палочек и колбочек?

Давайте посмотрим на этот график. Здесь мы видим концентрацию двух типов рецепторов в разных частях сетчатки. Так вот, оказывается, что практически все наши пиксели, которые создают чёткое и цветное изображение, т.е. колбочки, находятся в малюсенькой точке нашей “матрицы”. Красный скачок в середине графика. Это место называется Центральная ямка. Или Fovea.

Посмотрите на график, на нём наглядно показано распределение наших зрительных рецепторов. Если палочки, светочувствительные пиксели, распределены в основном по краям сетчатки. То вот колбочки, наши “цветные” пиксели, в основном сосредоточены в середине. То есть место, которое отвечает за цвет и чёткость картинки, занимает примерно 20% места на нашей матрице.

Палочки, которые отвечают за ч/б зрение находятся по периферии. Но самое интересное вот в чем. Выясняется, что колбочки, находящиеся в ямке, в основном подключены уже отдельными проводочками, чтобы улучшить качество итоговой картинки. И именно здесь они в приоритете. То есть их можно назвать классическими пикселями, как в камере смартфона!

Еще раз. Самые главные, четкие и цветные зрительные рецепторы расположены в самом центре нашей матрицы. Это около 1/6 процента площади всей сетчатки. Чтобы представить ее размер: он примерно соответствует площади ногтя на вытянутой руке.

И это действительно похоже на наш опыт: для того, чтобы внимательно рассмотреть предмет или прочитать текст, мы переводим на него взгляд. То есть как бы рассматриваем его центральной ямкой.

Но почему же тогда, если по бокам у сетчатки только черно-белые колбочки, периферийные объекты мы все равно видим цветными? Это тоже интересный аспект, о нем еще поговорим.

А ещё по этому графику видно, что угол обзора в ямке 0 градусов. То есть прямо по середине. Чем дальше мы удаляемся от центра, тем более размытым становится наше зрение, так как там становится слишком мало палочек и преобладают колбочки. То есть наше периферийное зрение, по этой логике должно быть серым и размытым. Так и есть! Заинтригованы? Но обо всём по порядку.

Такой подход может показаться странным. Но если подумать то всё логично. Это экономия ограниченного пространства в нашем глазу. Главное получить только в одном месте хорошее качество картинки, остальное за нас сделает наш мозг! Но об этом мы расскажем дальше.

DPI

А пока: давайте посчитаем. Мы предположили с каким качеством мегапикселей “фоткает” наш глаз цветное и детализированное изображение. Получается, что основные задачи по “фотографированию” реальности выполняет не вся сетчатка, а только наша центральная ямка. Там сосредоточены в большем количестве все наши колбочки. И более того, они подключены отдельно, совсем как пиксели в камерах.

А давайте сравним посчитаем DPI этой матрицы.

Что такое DPI? Это количество точек на дюйм. Давайте посчитаем у самой зоркой части нашего глаза, центральной ямки.

Сейчас будет чутка несложной математики, не пугайтесь, или включите ускорение.

150 000 * 645 = 96 750 000 точек / дюйм^2

Плотность колбочек известна: это в среднем гдето 150 тысяч на квадратный миллиметр. Или 96 750 000 на квадратный дюйм.

Корень из 96 750 000 = 9 836 точек/ дюйм

Но это количество точек на площадь, КВАДРАТНЫЙ дюйм. А нам нужно на 1 дюйм, то есть единицу длины. Тут тоже все просто — извлекаем квадратный корень. Получается 9 836. То есть плотность пикслей глаза в самой насыщенной точке это 9 836 DPI. Нехило так.

Для сравнения топовая кино камера Arri Alexa 65 стоимостью 10 млн рублей имеет матрицу с 3000 DPI. То есть глаз примерно втрое круче.

Вот такая занимательная математика от Droider. Но давайте немного передохнём от этих графиков, мы вернёмся к ним в конце. Займёмся прикладными тестами! Будет интересно.

Мы знаем, как устроены пиксели на сетчатке. Мы знаем их плотность в самой продвинутой области, но мы не знаем еще кое-чего.

Вернемся к графику. Возможно вы заметили на графике странную область правее центра? Там нету ни палочек, ни колбочек. Это слепое пятно на наших глазах! Сейчас расскажу поподробнее.

Слепое пятно, итоговое качество изображения.

Перед вами фотография, которая выявит несовершенство наших глаз. Откройте наше видео на экране побольше, желательно на компьютере, закройте правый глаз, посмотрите левым глазом на плюсик в кружочке. Правый плюсик исчез! Поздравляю, вы только что обнаружили слепое пятно вашего глаза. Что происходит?

Абсолютно все сигналы воспринимаемые нашими палочками и колбочками отправляются в наш мозг с помощью зрительного нерва. Его соединение находится прямо на сетчатке, поэтому там нет никаких сенсоров. Собственно он и есть причина нашего слепого пятна, мы видим начало этого “кабеля”.

Более того это не единственный конструктивный недостаток. Наш глаз нуждается в постоянном питании, поэтому всё глазное яблоко покрыто сосудами, которые поставляют энергию нашим глазам.

На самом деле, вот так мы видим по настоящему! Большой чёрный кружок, это наше слепое пятно, мы видим сосуды нашего глаза, а краски по окружности серые, так как там преобладают палочки. Обратите внимание, что посередине цветное изображение, это благодаря центральной ямке и концентрации в ней колбочек. Ах да, ещё мы видим наш нос, если смотрим прямо. Но как же в итоге получается это потрясающе четкая и широкоугольная картинка, которой вы наслаждаетесь прямо сейчас?

Мозг

Я думаю вы уже догадались, что без мощной нейронной сети тут не обошлось. Мозг — наш процессор, который в идеале освоил «фотошоп»!

Давайте разберемся, как он с этим справляется. Проблемы слепого пятна, наш процессор решает очень элегантно. У правого глаза пятно находится справа, у левого слева. Поэтому наш мозг накладывает на правый глаз изображение из левого и наоборот. Происходит взаимозамена и мы не видим никаких чёрных точек.

Сосуды, равно как и нос, наш мозг стирает из нашего восприятия. Есть предположения, что когда мы только появляемся на свет, наши глаза видят сосуды. Но со временем мозг учиться их игнорировать. Кстати, тут можно провести прямую параллель с камерами смартфона!

Есть две технологии расположения проводов в камере: устаревшая FSI и современная BSI. У FSI провода, питающие камеру находятся над пикселями, то есть так же как и наши сосуды. Потому она и устаревшая, так как эти провода препятствовали проходимости света. У BSI уже пиксели находятся над проводами, соответственно уже ничего не препятствует прохождению света. Получается наши глаза сделаны по устаревшей технологии FSI.

Надо не забывать, что изображение которое делают наши глаза плоское. Мозг сопоставляет их между собой и делает трёхмерными. Что-то похожее мы ощущаем когда смотрим фильм в 3D-очках. 3D-фильм снят с помощью двух камер, у которых угол съёмки немного различается, поэтому без очков мы видим две картинки одновременно, с разного угла зрения. Надевая очки обратно, нашему мозгу становится проще объединить эти изображения и картинка становится объёмнее. Так же происходит и у нас.

Наконец, изображение переворачивается, становится чётким и цветным! Если с переворотом изображения всё понятно, то почему картинка становится цветной и чёткой?

Ежесекундно, глаза делают множество микро-движений, так называемые саккады. Глаза сканируют окружающее пространство, а мозг объединяет снимки и превращает в видеоряд прекрасного качества. Это похоже на заполнение пустых фрагментов пазла.

Объясняю — у нас есть небольшой участок матрицы, который может делать цветное и чёткое фото. То есть у нашего мозга уже есть представление о том, каким цветом окрашен тот или иной объект благодаря сканированию. Всё что ему остаётся это сопоставить всю полученную информацию, объединить их в единую чёткую и цветную картинку. Именно поэтому мы видим боковым зрением цвета объектов, они уже записаны в оперативной памяти “процессора”. Немного напоминает раскрашенную версию 17 мгновений весны, но мозг справляется получше.

Фактически, мозг сам дорисовывает за нас итоговую картинку. Придумывает наше мировосприятие.

Забавный факт, для этой обработки и сопоставления результатов сканирования или собирания этого пазла, мозгу необходимо примерно 150 миллисекунд.

Во время этого процесса наше зрение отключается. Буквально. Мы ничего не видим. Но из-за такого малого промежутка по времени, наше сознание этого не замечает. То есть каждую секунду, мы страдаем временной слепотой!

Что там с ретиной?

Сканирование нам нужно из-за того, что в человеческом глазу очень ограниченное пространство. И сделать как в камере, чтобы к каждому пикселю был подключен свой проводок не получается.

Эволюция наградила нас зрительной ямкой, в которой, хоть и ограничено, но есть похожая технология как на матрице смартфона. Чтобы каждый участок видимого пространства попал на эту ямку и мы получили хорошую картинку, нам нужны две функции.

Первая, это сканер. Нужно захватить каждую точку в пространстве с помощью микродвижений, их как мы помним называют саккады. Саккады сканируют объект или пространство. Мы получаем кучу мелких пазлов, которые нам нужны для итоговой картинки.

Вторая функция, это наш мозг. Он собирает эти пазлы в единую картинку. Придаёт чёткости, дорисовывает объекты, наполняет красками. Создаёт виртуальное пространство в нашем сознании, из фотонов, которое мы воспринимаем как реальность.

Вот как то так мы воспринимаем мир, и вот так устроены глаза. Но все-таки. С какой точностью глаза это делают. И что там с Retina у Apple?

Давайте, наконец, попробуем решить задачку Стива Джобса. Итак, сколько точек на дюйм должно быть у экрана смартфона, лежащего в руке, чтобы мы не замечали на нем пиксели?

И теперь давайте решим несложную задачку по геометрии 7 класса.

Мы уже посчитали ,что DPI глаза в самом четком месте (центральной ямке) примерно 9 836 точек на дюйм. Если представить сетчатку в виде сетки пикселей, то размер одного пикселя будет 1 / 9 836 дюйма.

Вот здесь находится линза нашего глаза, хрусталик, через который проходит луч. А вот здесь пиксель смартфона в нашей руке. И он должен быть такого размера, чтобы пройдя через хрусталик, он спроектировался ровно в пиксель на сетчатке. Согласны? Вроде так.

Возможно, тут есть какие то допущения в плане оптики, но на порядок вычислений не повлияет. И теперь у нас получается два подобных треугольника. Это мы знаем — размер пикселя сетчатки. Фокусное расстояние мы тоже знаем, ведь это диаметр глазного яблока, примерно 22 мм. И это тоже знаем — расстояние до смартфона. Допустим, 30 см, как в школе учили держать книжку. Или 300 мм. Нам надо найти X.

x / 300 = ( 1 / 9836) / 22

А теперь получается простое уравнение, из которого выходит, что X, или размер искомого пикселя на экране, равен 1 / 721 дюйма. А значит плотность пикселей должна быть 721 DPI. Тогда на расстоянии в 30 см наш глаз такой пиксель не заметит. Доказано.

Получается, что для среднего смартфона, который мы будем держать на расстоянии 30 см, нужна плотность пикселей, аж целых 721 точек на дюйм! За всю историю смартфоностроения, только несколько моделей Сони Экспирия, добирались до таких показателей. Самый высокий был у Xperia XZ Premium — 807 PPI.

Так что iPhone 4 со своими 326 пикселей на дюйм и рядом не стоял. Старина Стив схитрил. Бывает. Занятно, что из текущих моделей самый высокий показатель у iPhone 13 mini — 476 PPI.

Но почему пиксели в смартфонах, в основном, не режут нам глаза? Apple и прочие компании прячут пиксели другими технологиями. Это уже другая история.

Ладно, главный вопрос: сколько все-таки мегапикселей в глазах? Однозначно ответить сложно, так как аналогия не точна: потому что для камеры все области матрицы идентичны, а для глаза нет. Можно считать, что это 127 Мп по количеству клеток сенсоров. Или что 1 Мп по количеству соединений с мозгом. А можно провести мысленный эксперимент и предположить, что мозг заполняет все видимое пространство с точностью центральной ямки? Можно и так, тогда выйдет около 164 МП на глаз.

Получается, наш глаз не “фоткает” целиком, а производит сканирование окружающего мира. Для этого мы захватываем каждую видимую точки микродвижениями — саккадами. А получившиеся данные соединяет и обрабатывает мозг. Так получается единая картинка.