Для того, чтобы определить окончание слова, его действительно нужно просклонять, и делать это нужно, принимая во внимание не буквы, а звуки. Почему? Потому что мы говорим звуками, а не буквами, и даже неграмотный человек, не умеющий писать, всё ещё говорит на родном языке, если он способен издавать членораздельные звуки.
В данном случае у слова "сарай" нулевая флексия (нулевое окончание). Основа слова состоит из корня без приставок или суффиксов - сарай. При склонении на письме последний звук основы и первый звук окончания выражаются одной из букв, которые могут выражать 2 звука на письме (я, ю, е), например
Р. п. сарая [сарайа]
Д. п. сараю [сарайу]
Т. п. сараем [сарайэм]
П. п. (о) сарае [сарайэ]
и т. д. (по правилам фонетической транскрипции для учащихся средней школы).
На этом фоне странно выглядит форма множественного числа - сараи. В нём конечный [й] "исчезает". Куда? Почему?
Слово "сарай" - заимствованное, оно пришло в русский язык из персидского при посредстве тюркских диалектов, поэтому оно не отражает фонетических особенностей русского языка. Таким образом, при склонении возникла ситуация, которая невозможна при склонении исконно русских слов - комбинация звуков, несвойственная русскому языку, приводящая к фонетическим процессам, также несвойственным русскому языку.
Школьная фонетическая транскрипция здесь не поможет - обратимся к транскрипции по стандартам МФА - [sɐrˈaɪ]. Последний звук - ненапряжённый неогубленный гласный переднего ряда верхнего подъёма, встречающийся в русском языке в неударных позициях. Этот звук "поглотил", вобрал в себя и конечный звук основы, и флексию.
В родственном русскому языке - украинском - произошли иные процессы: конечный согласный основы сохранился, к нему присоединяется флексия, состоящая из одного гласного звука. Произносится это как "сарайи", пишется - сараї. Последняя буква - ї - используется для передачи комбинации звуков [йи].