]> git.kernelconcepts.de Git - karo-tx-linux.git/blob - arch/x86/include/asm/pgtable.h
x86/mm/gup: Switch GUP to the generic get_user_page_fast() implementation
[karo-tx-linux.git] / arch / x86 / include / asm / pgtable.h
1 #ifndef _ASM_X86_PGTABLE_H
2 #define _ASM_X86_PGTABLE_H
3
4 #include <asm/page.h>
5 #include <asm/e820.h>
6
7 #include <asm/pgtable_types.h>
8
9 /*
10  * Macro to mark a page protection value as UC-
11  */
12 #define pgprot_noncached(prot)                                          \
13         ((boot_cpu_data.x86 > 3)                                        \
14          ? (__pgprot(pgprot_val(prot) |                                 \
15                      cachemode2protval(_PAGE_CACHE_MODE_UC_MINUS)))     \
16          : (prot))
17
18 #ifndef __ASSEMBLY__
19 #include <asm/x86_init.h>
20
21 void ptdump_walk_pgd_level(struct seq_file *m, pgd_t *pgd);
22 void ptdump_walk_pgd_level_checkwx(void);
23
24 #ifdef CONFIG_DEBUG_WX
25 #define debug_checkwx() ptdump_walk_pgd_level_checkwx()
26 #else
27 #define debug_checkwx() do { } while (0)
28 #endif
29
30 /*
31  * ZERO_PAGE is a global shared page that is always zero: used
32  * for zero-mapped memory areas etc..
33  */
34 extern unsigned long empty_zero_page[PAGE_SIZE / sizeof(unsigned long)]
35         __visible;
36 #define ZERO_PAGE(vaddr) (virt_to_page(empty_zero_page))
37
38 extern spinlock_t pgd_lock;
39 extern struct list_head pgd_list;
40
41 extern struct mm_struct *pgd_page_get_mm(struct page *page);
42
43 #ifdef CONFIG_PARAVIRT
44 #include <asm/paravirt.h>
45 #else  /* !CONFIG_PARAVIRT */
46 #define set_pte(ptep, pte)              native_set_pte(ptep, pte)
47 #define set_pte_at(mm, addr, ptep, pte) native_set_pte_at(mm, addr, ptep, pte)
48 #define set_pmd_at(mm, addr, pmdp, pmd) native_set_pmd_at(mm, addr, pmdp, pmd)
49 #define set_pud_at(mm, addr, pudp, pud) native_set_pud_at(mm, addr, pudp, pud)
50
51 #define set_pte_atomic(ptep, pte)                                       \
52         native_set_pte_atomic(ptep, pte)
53
54 #define set_pmd(pmdp, pmd)              native_set_pmd(pmdp, pmd)
55
56 #ifndef __PAGETABLE_PUD_FOLDED
57 #define set_pgd(pgdp, pgd)              native_set_pgd(pgdp, pgd)
58 #define pgd_clear(pgd)                  native_pgd_clear(pgd)
59 #endif
60
61 #ifndef set_pud
62 # define set_pud(pudp, pud)             native_set_pud(pudp, pud)
63 #endif
64
65 #ifndef __PAGETABLE_PMD_FOLDED
66 #define pud_clear(pud)                  native_pud_clear(pud)
67 #endif
68
69 #define pte_clear(mm, addr, ptep)       native_pte_clear(mm, addr, ptep)
70 #define pmd_clear(pmd)                  native_pmd_clear(pmd)
71
72 #define pte_update(mm, addr, ptep)              do { } while (0)
73
74 #define pgd_val(x)      native_pgd_val(x)
75 #define __pgd(x)        native_make_pgd(x)
76
77 #ifndef __PAGETABLE_PUD_FOLDED
78 #define pud_val(x)      native_pud_val(x)
79 #define __pud(x)        native_make_pud(x)
80 #endif
81
82 #ifndef __PAGETABLE_PMD_FOLDED
83 #define pmd_val(x)      native_pmd_val(x)
84 #define __pmd(x)        native_make_pmd(x)
85 #endif
86
87 #define pte_val(x)      native_pte_val(x)
88 #define __pte(x)        native_make_pte(x)
89
90 #define arch_end_context_switch(prev)   do {} while(0)
91
92 #endif  /* CONFIG_PARAVIRT */
93
94 /*
95  * The following only work if pte_present() is true.
96  * Undefined behaviour if not..
97  */
98 static inline int pte_dirty(pte_t pte)
99 {
100         return pte_flags(pte) & _PAGE_DIRTY;
101 }
102
103
104 static inline u32 read_pkru(void)
105 {
106         if (boot_cpu_has(X86_FEATURE_OSPKE))
107                 return __read_pkru();
108         return 0;
109 }
110
111 static inline void write_pkru(u32 pkru)
112 {
113         if (boot_cpu_has(X86_FEATURE_OSPKE))
114                 __write_pkru(pkru);
115 }
116
117 static inline int pte_young(pte_t pte)
118 {
119         return pte_flags(pte) & _PAGE_ACCESSED;
120 }
121
122 static inline int pmd_dirty(pmd_t pmd)
123 {
124         return pmd_flags(pmd) & _PAGE_DIRTY;
125 }
126
127 static inline int pmd_young(pmd_t pmd)
128 {
129         return pmd_flags(pmd) & _PAGE_ACCESSED;
130 }
131
132 static inline int pud_dirty(pud_t pud)
133 {
134         return pud_flags(pud) & _PAGE_DIRTY;
135 }
136
137 static inline int pud_young(pud_t pud)
138 {
139         return pud_flags(pud) & _PAGE_ACCESSED;
140 }
141
142 static inline int pte_write(pte_t pte)
143 {
144         return pte_flags(pte) & _PAGE_RW;
145 }
146
147 static inline int pte_huge(pte_t pte)
148 {
149         return pte_flags(pte) & _PAGE_PSE;
150 }
151
152 static inline int pte_global(pte_t pte)
153 {
154         return pte_flags(pte) & _PAGE_GLOBAL;
155 }
156
157 static inline int pte_exec(pte_t pte)
158 {
159         return !(pte_flags(pte) & _PAGE_NX);
160 }
161
162 static inline int pte_special(pte_t pte)
163 {
164         return pte_flags(pte) & _PAGE_SPECIAL;
165 }
166
167 static inline unsigned long pte_pfn(pte_t pte)
168 {
169         return (pte_val(pte) & PTE_PFN_MASK) >> PAGE_SHIFT;
170 }
171
172 static inline unsigned long pmd_pfn(pmd_t pmd)
173 {
174         return (pmd_val(pmd) & pmd_pfn_mask(pmd)) >> PAGE_SHIFT;
175 }
176
177 static inline unsigned long pud_pfn(pud_t pud)
178 {
179         return (pud_val(pud) & pud_pfn_mask(pud)) >> PAGE_SHIFT;
180 }
181
182 static inline unsigned long p4d_pfn(p4d_t p4d)
183 {
184         return (p4d_val(p4d) & p4d_pfn_mask(p4d)) >> PAGE_SHIFT;
185 }
186
187 static inline int p4d_large(p4d_t p4d)
188 {
189         /* No 512 GiB pages yet */
190         return 0;
191 }
192
193 #define pte_page(pte)   pfn_to_page(pte_pfn(pte))
194
195 static inline int pmd_large(pmd_t pte)
196 {
197         return pmd_flags(pte) & _PAGE_PSE;
198 }
199
200 #ifdef CONFIG_TRANSPARENT_HUGEPAGE
201 static inline int pmd_trans_huge(pmd_t pmd)
202 {
203         return (pmd_val(pmd) & (_PAGE_PSE|_PAGE_DEVMAP)) == _PAGE_PSE;
204 }
205
206 #ifdef CONFIG_HAVE_ARCH_TRANSPARENT_HUGEPAGE_PUD
207 static inline int pud_trans_huge(pud_t pud)
208 {
209         return (pud_val(pud) & (_PAGE_PSE|_PAGE_DEVMAP)) == _PAGE_PSE;
210 }
211 #endif
212
213 #define has_transparent_hugepage has_transparent_hugepage
214 static inline int has_transparent_hugepage(void)
215 {
216         return boot_cpu_has(X86_FEATURE_PSE);
217 }
218
219 #ifdef __HAVE_ARCH_PTE_DEVMAP
220 static inline int pmd_devmap(pmd_t pmd)
221 {
222         return !!(pmd_val(pmd) & _PAGE_DEVMAP);
223 }
224
225 #ifdef CONFIG_HAVE_ARCH_TRANSPARENT_HUGEPAGE_PUD
226 static inline int pud_devmap(pud_t pud)
227 {
228         return !!(pud_val(pud) & _PAGE_DEVMAP);
229 }
230 #else
231 static inline int pud_devmap(pud_t pud)
232 {
233         return 0;
234 }
235 #endif
236
237 static inline int pgd_devmap(pgd_t pgd)
238 {
239         return 0;
240 }
241 #endif
242 #endif /* CONFIG_TRANSPARENT_HUGEPAGE */
243
244 static inline pte_t pte_set_flags(pte_t pte, pteval_t set)
245 {
246         pteval_t v = native_pte_val(pte);
247
248         return native_make_pte(v | set);
249 }
250
251 static inline pte_t pte_clear_flags(pte_t pte, pteval_t clear)
252 {
253         pteval_t v = native_pte_val(pte);
254
255         return native_make_pte(v & ~clear);
256 }
257
258 static inline pte_t pte_mkclean(pte_t pte)
259 {
260         return pte_clear_flags(pte, _PAGE_DIRTY);
261 }
262
263 static inline pte_t pte_mkold(pte_t pte)
264 {
265         return pte_clear_flags(pte, _PAGE_ACCESSED);
266 }
267
268 static inline pte_t pte_wrprotect(pte_t pte)
269 {
270         return pte_clear_flags(pte, _PAGE_RW);
271 }
272
273 static inline pte_t pte_mkexec(pte_t pte)
274 {
275         return pte_clear_flags(pte, _PAGE_NX);
276 }
277
278 static inline pte_t pte_mkdirty(pte_t pte)
279 {
280         return pte_set_flags(pte, _PAGE_DIRTY | _PAGE_SOFT_DIRTY);
281 }
282
283 static inline pte_t pte_mkyoung(pte_t pte)
284 {
285         return pte_set_flags(pte, _PAGE_ACCESSED);
286 }
287
288 static inline pte_t pte_mkwrite(pte_t pte)
289 {
290         return pte_set_flags(pte, _PAGE_RW);
291 }
292
293 static inline pte_t pte_mkhuge(pte_t pte)
294 {
295         return pte_set_flags(pte, _PAGE_PSE);
296 }
297
298 static inline pte_t pte_clrhuge(pte_t pte)
299 {
300         return pte_clear_flags(pte, _PAGE_PSE);
301 }
302
303 static inline pte_t pte_mkglobal(pte_t pte)
304 {
305         return pte_set_flags(pte, _PAGE_GLOBAL);
306 }
307
308 static inline pte_t pte_clrglobal(pte_t pte)
309 {
310         return pte_clear_flags(pte, _PAGE_GLOBAL);
311 }
312
313 static inline pte_t pte_mkspecial(pte_t pte)
314 {
315         return pte_set_flags(pte, _PAGE_SPECIAL);
316 }
317
318 static inline pte_t pte_mkdevmap(pte_t pte)
319 {
320         return pte_set_flags(pte, _PAGE_SPECIAL|_PAGE_DEVMAP);
321 }
322
323 static inline pmd_t pmd_set_flags(pmd_t pmd, pmdval_t set)
324 {
325         pmdval_t v = native_pmd_val(pmd);
326
327         return __pmd(v | set);
328 }
329
330 static inline pmd_t pmd_clear_flags(pmd_t pmd, pmdval_t clear)
331 {
332         pmdval_t v = native_pmd_val(pmd);
333
334         return __pmd(v & ~clear);
335 }
336
337 static inline pmd_t pmd_mkold(pmd_t pmd)
338 {
339         return pmd_clear_flags(pmd, _PAGE_ACCESSED);
340 }
341
342 static inline pmd_t pmd_mkclean(pmd_t pmd)
343 {
344         return pmd_clear_flags(pmd, _PAGE_DIRTY);
345 }
346
347 static inline pmd_t pmd_wrprotect(pmd_t pmd)
348 {
349         return pmd_clear_flags(pmd, _PAGE_RW);
350 }
351
352 static inline pmd_t pmd_mkdirty(pmd_t pmd)
353 {
354         return pmd_set_flags(pmd, _PAGE_DIRTY | _PAGE_SOFT_DIRTY);
355 }
356
357 static inline pmd_t pmd_mkdevmap(pmd_t pmd)
358 {
359         return pmd_set_flags(pmd, _PAGE_DEVMAP);
360 }
361
362 static inline pmd_t pmd_mkhuge(pmd_t pmd)
363 {
364         return pmd_set_flags(pmd, _PAGE_PSE);
365 }
366
367 static inline pmd_t pmd_mkyoung(pmd_t pmd)
368 {
369         return pmd_set_flags(pmd, _PAGE_ACCESSED);
370 }
371
372 static inline pmd_t pmd_mkwrite(pmd_t pmd)
373 {
374         return pmd_set_flags(pmd, _PAGE_RW);
375 }
376
377 static inline pmd_t pmd_mknotpresent(pmd_t pmd)
378 {
379         return pmd_clear_flags(pmd, _PAGE_PRESENT | _PAGE_PROTNONE);
380 }
381
382 static inline pud_t pud_set_flags(pud_t pud, pudval_t set)
383 {
384         pudval_t v = native_pud_val(pud);
385
386         return __pud(v | set);
387 }
388
389 static inline pud_t pud_clear_flags(pud_t pud, pudval_t clear)
390 {
391         pudval_t v = native_pud_val(pud);
392
393         return __pud(v & ~clear);
394 }
395
396 static inline pud_t pud_mkold(pud_t pud)
397 {
398         return pud_clear_flags(pud, _PAGE_ACCESSED);
399 }
400
401 static inline pud_t pud_mkclean(pud_t pud)
402 {
403         return pud_clear_flags(pud, _PAGE_DIRTY);
404 }
405
406 static inline pud_t pud_wrprotect(pud_t pud)
407 {
408         return pud_clear_flags(pud, _PAGE_RW);
409 }
410
411 static inline pud_t pud_mkdirty(pud_t pud)
412 {
413         return pud_set_flags(pud, _PAGE_DIRTY | _PAGE_SOFT_DIRTY);
414 }
415
416 static inline pud_t pud_mkdevmap(pud_t pud)
417 {
418         return pud_set_flags(pud, _PAGE_DEVMAP);
419 }
420
421 static inline pud_t pud_mkhuge(pud_t pud)
422 {
423         return pud_set_flags(pud, _PAGE_PSE);
424 }
425
426 static inline pud_t pud_mkyoung(pud_t pud)
427 {
428         return pud_set_flags(pud, _PAGE_ACCESSED);
429 }
430
431 static inline pud_t pud_mkwrite(pud_t pud)
432 {
433         return pud_set_flags(pud, _PAGE_RW);
434 }
435
436 static inline pud_t pud_mknotpresent(pud_t pud)
437 {
438         return pud_clear_flags(pud, _PAGE_PRESENT | _PAGE_PROTNONE);
439 }
440
441 #ifdef CONFIG_HAVE_ARCH_SOFT_DIRTY
442 static inline int pte_soft_dirty(pte_t pte)
443 {
444         return pte_flags(pte) & _PAGE_SOFT_DIRTY;
445 }
446
447 static inline int pmd_soft_dirty(pmd_t pmd)
448 {
449         return pmd_flags(pmd) & _PAGE_SOFT_DIRTY;
450 }
451
452 static inline int pud_soft_dirty(pud_t pud)
453 {
454         return pud_flags(pud) & _PAGE_SOFT_DIRTY;
455 }
456
457 static inline pte_t pte_mksoft_dirty(pte_t pte)
458 {
459         return pte_set_flags(pte, _PAGE_SOFT_DIRTY);
460 }
461
462 static inline pmd_t pmd_mksoft_dirty(pmd_t pmd)
463 {
464         return pmd_set_flags(pmd, _PAGE_SOFT_DIRTY);
465 }
466
467 static inline pud_t pud_mksoft_dirty(pud_t pud)
468 {
469         return pud_set_flags(pud, _PAGE_SOFT_DIRTY);
470 }
471
472 static inline pte_t pte_clear_soft_dirty(pte_t pte)
473 {
474         return pte_clear_flags(pte, _PAGE_SOFT_DIRTY);
475 }
476
477 static inline pmd_t pmd_clear_soft_dirty(pmd_t pmd)
478 {
479         return pmd_clear_flags(pmd, _PAGE_SOFT_DIRTY);
480 }
481
482 static inline pud_t pud_clear_soft_dirty(pud_t pud)
483 {
484         return pud_clear_flags(pud, _PAGE_SOFT_DIRTY);
485 }
486
487 #endif /* CONFIG_HAVE_ARCH_SOFT_DIRTY */
488
489 /*
490  * Mask out unsupported bits in a present pgprot.  Non-present pgprots
491  * can use those bits for other purposes, so leave them be.
492  */
493 static inline pgprotval_t massage_pgprot(pgprot_t pgprot)
494 {
495         pgprotval_t protval = pgprot_val(pgprot);
496
497         if (protval & _PAGE_PRESENT)
498                 protval &= __supported_pte_mask;
499
500         return protval;
501 }
502
503 static inline pte_t pfn_pte(unsigned long page_nr, pgprot_t pgprot)
504 {
505         return __pte(((phys_addr_t)page_nr << PAGE_SHIFT) |
506                      massage_pgprot(pgprot));
507 }
508
509 static inline pmd_t pfn_pmd(unsigned long page_nr, pgprot_t pgprot)
510 {
511         return __pmd(((phys_addr_t)page_nr << PAGE_SHIFT) |
512                      massage_pgprot(pgprot));
513 }
514
515 static inline pud_t pfn_pud(unsigned long page_nr, pgprot_t pgprot)
516 {
517         return __pud(((phys_addr_t)page_nr << PAGE_SHIFT) |
518                      massage_pgprot(pgprot));
519 }
520
521 static inline pte_t pte_modify(pte_t pte, pgprot_t newprot)
522 {
523         pteval_t val = pte_val(pte);
524
525         /*
526          * Chop off the NX bit (if present), and add the NX portion of
527          * the newprot (if present):
528          */
529         val &= _PAGE_CHG_MASK;
530         val |= massage_pgprot(newprot) & ~_PAGE_CHG_MASK;
531
532         return __pte(val);
533 }
534
535 static inline pmd_t pmd_modify(pmd_t pmd, pgprot_t newprot)
536 {
537         pmdval_t val = pmd_val(pmd);
538
539         val &= _HPAGE_CHG_MASK;
540         val |= massage_pgprot(newprot) & ~_HPAGE_CHG_MASK;
541
542         return __pmd(val);
543 }
544
545 /* mprotect needs to preserve PAT bits when updating vm_page_prot */
546 #define pgprot_modify pgprot_modify
547 static inline pgprot_t pgprot_modify(pgprot_t oldprot, pgprot_t newprot)
548 {
549         pgprotval_t preservebits = pgprot_val(oldprot) & _PAGE_CHG_MASK;
550         pgprotval_t addbits = pgprot_val(newprot);
551         return __pgprot(preservebits | addbits);
552 }
553
554 #define pte_pgprot(x) __pgprot(pte_flags(x))
555 #define pmd_pgprot(x) __pgprot(pmd_flags(x))
556 #define pud_pgprot(x) __pgprot(pud_flags(x))
557
558 #define canon_pgprot(p) __pgprot(massage_pgprot(p))
559
560 static inline int is_new_memtype_allowed(u64 paddr, unsigned long size,
561                                          enum page_cache_mode pcm,
562                                          enum page_cache_mode new_pcm)
563 {
564         /*
565          * PAT type is always WB for untracked ranges, so no need to check.
566          */
567         if (x86_platform.is_untracked_pat_range(paddr, paddr + size))
568                 return 1;
569
570         /*
571          * Certain new memtypes are not allowed with certain
572          * requested memtype:
573          * - request is uncached, return cannot be write-back
574          * - request is write-combine, return cannot be write-back
575          * - request is write-through, return cannot be write-back
576          * - request is write-through, return cannot be write-combine
577          */
578         if ((pcm == _PAGE_CACHE_MODE_UC_MINUS &&
579              new_pcm == _PAGE_CACHE_MODE_WB) ||
580             (pcm == _PAGE_CACHE_MODE_WC &&
581              new_pcm == _PAGE_CACHE_MODE_WB) ||
582             (pcm == _PAGE_CACHE_MODE_WT &&
583              new_pcm == _PAGE_CACHE_MODE_WB) ||
584             (pcm == _PAGE_CACHE_MODE_WT &&
585              new_pcm == _PAGE_CACHE_MODE_WC)) {
586                 return 0;
587         }
588
589         return 1;
590 }
591
592 pmd_t *populate_extra_pmd(unsigned long vaddr);
593 pte_t *populate_extra_pte(unsigned long vaddr);
594 #endif  /* __ASSEMBLY__ */
595
596 #ifdef CONFIG_X86_32
597 # include <asm/pgtable_32.h>
598 #else
599 # include <asm/pgtable_64.h>
600 #endif
601
602 #ifndef __ASSEMBLY__
603 #include <linux/mm_types.h>
604 #include <linux/mmdebug.h>
605 #include <linux/log2.h>
606
607 static inline int pte_none(pte_t pte)
608 {
609         return !(pte.pte & ~(_PAGE_KNL_ERRATUM_MASK));
610 }
611
612 #define __HAVE_ARCH_PTE_SAME
613 static inline int pte_same(pte_t a, pte_t b)
614 {
615         return a.pte == b.pte;
616 }
617
618 static inline int pte_present(pte_t a)
619 {
620         return pte_flags(a) & (_PAGE_PRESENT | _PAGE_PROTNONE);
621 }
622
623 #ifdef __HAVE_ARCH_PTE_DEVMAP
624 static inline int pte_devmap(pte_t a)
625 {
626         return (pte_flags(a) & _PAGE_DEVMAP) == _PAGE_DEVMAP;
627 }
628 #endif
629
630 #define pte_accessible pte_accessible
631 static inline bool pte_accessible(struct mm_struct *mm, pte_t a)
632 {
633         if (pte_flags(a) & _PAGE_PRESENT)
634                 return true;
635
636         if ((pte_flags(a) & _PAGE_PROTNONE) &&
637                         mm_tlb_flush_pending(mm))
638                 return true;
639
640         return false;
641 }
642
643 static inline int pte_hidden(pte_t pte)
644 {
645         return pte_flags(pte) & _PAGE_HIDDEN;
646 }
647
648 static inline int pmd_present(pmd_t pmd)
649 {
650         /*
651          * Checking for _PAGE_PSE is needed too because
652          * split_huge_page will temporarily clear the present bit (but
653          * the _PAGE_PSE flag will remain set at all times while the
654          * _PAGE_PRESENT bit is clear).
655          */
656         return pmd_flags(pmd) & (_PAGE_PRESENT | _PAGE_PROTNONE | _PAGE_PSE);
657 }
658
659 #ifdef CONFIG_NUMA_BALANCING
660 /*
661  * These work without NUMA balancing but the kernel does not care. See the
662  * comment in include/asm-generic/pgtable.h
663  */
664 static inline int pte_protnone(pte_t pte)
665 {
666         return (pte_flags(pte) & (_PAGE_PROTNONE | _PAGE_PRESENT))
667                 == _PAGE_PROTNONE;
668 }
669
670 static inline int pmd_protnone(pmd_t pmd)
671 {
672         return (pmd_flags(pmd) & (_PAGE_PROTNONE | _PAGE_PRESENT))
673                 == _PAGE_PROTNONE;
674 }
675 #endif /* CONFIG_NUMA_BALANCING */
676
677 static inline int pmd_none(pmd_t pmd)
678 {
679         /* Only check low word on 32-bit platforms, since it might be
680            out of sync with upper half. */
681         unsigned long val = native_pmd_val(pmd);
682         return (val & ~_PAGE_KNL_ERRATUM_MASK) == 0;
683 }
684
685 static inline unsigned long pmd_page_vaddr(pmd_t pmd)
686 {
687         return (unsigned long)__va(pmd_val(pmd) & pmd_pfn_mask(pmd));
688 }
689
690 /*
691  * Currently stuck as a macro due to indirect forward reference to
692  * linux/mmzone.h's __section_mem_map_addr() definition:
693  */
694 #define pmd_page(pmd)           \
695         pfn_to_page((pmd_val(pmd) & pmd_pfn_mask(pmd)) >> PAGE_SHIFT)
696
697 /*
698  * the pmd page can be thought of an array like this: pmd_t[PTRS_PER_PMD]
699  *
700  * this macro returns the index of the entry in the pmd page which would
701  * control the given virtual address
702  */
703 static inline unsigned long pmd_index(unsigned long address)
704 {
705         return (address >> PMD_SHIFT) & (PTRS_PER_PMD - 1);
706 }
707
708 /*
709  * Conversion functions: convert a page and protection to a page entry,
710  * and a page entry and page directory to the page they refer to.
711  *
712  * (Currently stuck as a macro because of indirect forward reference
713  * to linux/mm.h:page_to_nid())
714  */
715 #define mk_pte(page, pgprot)   pfn_pte(page_to_pfn(page), (pgprot))
716
717 /*
718  * the pte page can be thought of an array like this: pte_t[PTRS_PER_PTE]
719  *
720  * this function returns the index of the entry in the pte page which would
721  * control the given virtual address
722  */
723 static inline unsigned long pte_index(unsigned long address)
724 {
725         return (address >> PAGE_SHIFT) & (PTRS_PER_PTE - 1);
726 }
727
728 static inline pte_t *pte_offset_kernel(pmd_t *pmd, unsigned long address)
729 {
730         return (pte_t *)pmd_page_vaddr(*pmd) + pte_index(address);
731 }
732
733 static inline int pmd_bad(pmd_t pmd)
734 {
735         return (pmd_flags(pmd) & ~_PAGE_USER) != _KERNPG_TABLE;
736 }
737
738 static inline unsigned long pages_to_mb(unsigned long npg)
739 {
740         return npg >> (20 - PAGE_SHIFT);
741 }
742
743 #if CONFIG_PGTABLE_LEVELS > 2
744 static inline int pud_none(pud_t pud)
745 {
746         return (native_pud_val(pud) & ~(_PAGE_KNL_ERRATUM_MASK)) == 0;
747 }
748
749 static inline int pud_present(pud_t pud)
750 {
751         return pud_flags(pud) & _PAGE_PRESENT;
752 }
753
754 static inline unsigned long pud_page_vaddr(pud_t pud)
755 {
756         return (unsigned long)__va(pud_val(pud) & pud_pfn_mask(pud));
757 }
758
759 /*
760  * Currently stuck as a macro due to indirect forward reference to
761  * linux/mmzone.h's __section_mem_map_addr() definition:
762  */
763 #define pud_page(pud)           \
764         pfn_to_page((pud_val(pud) & pud_pfn_mask(pud)) >> PAGE_SHIFT)
765
766 /* Find an entry in the second-level page table.. */
767 static inline pmd_t *pmd_offset(pud_t *pud, unsigned long address)
768 {
769         return (pmd_t *)pud_page_vaddr(*pud) + pmd_index(address);
770 }
771
772 static inline int pud_large(pud_t pud)
773 {
774         return (pud_val(pud) & (_PAGE_PSE | _PAGE_PRESENT)) ==
775                 (_PAGE_PSE | _PAGE_PRESENT);
776 }
777
778 static inline int pud_bad(pud_t pud)
779 {
780         return (pud_flags(pud) & ~(_KERNPG_TABLE | _PAGE_USER)) != 0;
781 }
782 #else
783 static inline int pud_large(pud_t pud)
784 {
785         return 0;
786 }
787 #endif  /* CONFIG_PGTABLE_LEVELS > 2 */
788
789 static inline unsigned long pud_index(unsigned long address)
790 {
791         return (address >> PUD_SHIFT) & (PTRS_PER_PUD - 1);
792 }
793
794 static inline unsigned long p4d_index(unsigned long address)
795 {
796         return (address >> P4D_SHIFT) & (PTRS_PER_P4D - 1);
797 }
798
799 #if CONFIG_PGTABLE_LEVELS > 3
800 static inline int pgd_present(pgd_t pgd)
801 {
802         return pgd_flags(pgd) & _PAGE_PRESENT;
803 }
804
805 static inline unsigned long pgd_page_vaddr(pgd_t pgd)
806 {
807         return (unsigned long)__va((unsigned long)pgd_val(pgd) & PTE_PFN_MASK);
808 }
809
810 /*
811  * Currently stuck as a macro due to indirect forward reference to
812  * linux/mmzone.h's __section_mem_map_addr() definition:
813  */
814 #define pgd_page(pgd)           pfn_to_page(pgd_val(pgd) >> PAGE_SHIFT)
815
816 /* to find an entry in a page-table-directory. */
817 static inline pud_t *pud_offset(pgd_t *pgd, unsigned long address)
818 {
819         return (pud_t *)pgd_page_vaddr(*pgd) + pud_index(address);
820 }
821
822 static inline int pgd_bad(pgd_t pgd)
823 {
824         return (pgd_flags(pgd) & ~_PAGE_USER) != _KERNPG_TABLE;
825 }
826
827 static inline int pgd_none(pgd_t pgd)
828 {
829         /*
830          * There is no need to do a workaround for the KNL stray
831          * A/D bit erratum here.  PGDs only point to page tables
832          * except on 32-bit non-PAE which is not supported on
833          * KNL.
834          */
835         return !native_pgd_val(pgd);
836 }
837 #endif  /* CONFIG_PGTABLE_LEVELS > 3 */
838
839 #endif  /* __ASSEMBLY__ */
840
841 /*
842  * the pgd page can be thought of an array like this: pgd_t[PTRS_PER_PGD]
843  *
844  * this macro returns the index of the entry in the pgd page which would
845  * control the given virtual address
846  */
847 #define pgd_index(address) (((address) >> PGDIR_SHIFT) & (PTRS_PER_PGD - 1))
848
849 /*
850  * pgd_offset() returns a (pgd_t *)
851  * pgd_index() is used get the offset into the pgd page's array of pgd_t's;
852  */
853 #define pgd_offset(mm, address) ((mm)->pgd + pgd_index((address)))
854 /*
855  * a shortcut which implies the use of the kernel's pgd, instead
856  * of a process's
857  */
858 #define pgd_offset_k(address) pgd_offset(&init_mm, (address))
859
860
861 #define KERNEL_PGD_BOUNDARY     pgd_index(PAGE_OFFSET)
862 #define KERNEL_PGD_PTRS         (PTRS_PER_PGD - KERNEL_PGD_BOUNDARY)
863
864 #ifndef __ASSEMBLY__
865
866 extern int direct_gbpages;
867 void init_mem_mapping(void);
868 void early_alloc_pgt_buf(void);
869
870 #ifdef CONFIG_X86_64
871 /* Realmode trampoline initialization. */
872 extern pgd_t trampoline_pgd_entry;
873 static inline void __meminit init_trampoline_default(void)
874 {
875         /* Default trampoline pgd value */
876         trampoline_pgd_entry = init_level4_pgt[pgd_index(__PAGE_OFFSET)];
877 }
878 # ifdef CONFIG_RANDOMIZE_MEMORY
879 void __meminit init_trampoline(void);
880 # else
881 #  define init_trampoline init_trampoline_default
882 # endif
883 #else
884 static inline void init_trampoline(void) { }
885 #endif
886
887 /* local pte updates need not use xchg for locking */
888 static inline pte_t native_local_ptep_get_and_clear(pte_t *ptep)
889 {
890         pte_t res = *ptep;
891
892         /* Pure native function needs no input for mm, addr */
893         native_pte_clear(NULL, 0, ptep);
894         return res;
895 }
896
897 static inline pmd_t native_local_pmdp_get_and_clear(pmd_t *pmdp)
898 {
899         pmd_t res = *pmdp;
900
901         native_pmd_clear(pmdp);
902         return res;
903 }
904
905 static inline pud_t native_local_pudp_get_and_clear(pud_t *pudp)
906 {
907         pud_t res = *pudp;
908
909         native_pud_clear(pudp);
910         return res;
911 }
912
913 static inline void native_set_pte_at(struct mm_struct *mm, unsigned long addr,
914                                      pte_t *ptep , pte_t pte)
915 {
916         native_set_pte(ptep, pte);
917 }
918
919 static inline void native_set_pmd_at(struct mm_struct *mm, unsigned long addr,
920                                      pmd_t *pmdp , pmd_t pmd)
921 {
922         native_set_pmd(pmdp, pmd);
923 }
924
925 static inline void native_set_pud_at(struct mm_struct *mm, unsigned long addr,
926                                      pud_t *pudp, pud_t pud)
927 {
928         native_set_pud(pudp, pud);
929 }
930
931 #ifndef CONFIG_PARAVIRT
932 /*
933  * Rules for using pte_update - it must be called after any PTE update which
934  * has not been done using the set_pte / clear_pte interfaces.  It is used by
935  * shadow mode hypervisors to resynchronize the shadow page tables.  Kernel PTE
936  * updates should either be sets, clears, or set_pte_atomic for P->P
937  * transitions, which means this hook should only be called for user PTEs.
938  * This hook implies a P->P protection or access change has taken place, which
939  * requires a subsequent TLB flush.
940  */
941 #define pte_update(mm, addr, ptep)              do { } while (0)
942 #endif
943
944 /*
945  * We only update the dirty/accessed state if we set
946  * the dirty bit by hand in the kernel, since the hardware
947  * will do the accessed bit for us, and we don't want to
948  * race with other CPU's that might be updating the dirty
949  * bit at the same time.
950  */
951 struct vm_area_struct;
952
953 #define  __HAVE_ARCH_PTEP_SET_ACCESS_FLAGS
954 extern int ptep_set_access_flags(struct vm_area_struct *vma,
955                                  unsigned long address, pte_t *ptep,
956                                  pte_t entry, int dirty);
957
958 #define __HAVE_ARCH_PTEP_TEST_AND_CLEAR_YOUNG
959 extern int ptep_test_and_clear_young(struct vm_area_struct *vma,
960                                      unsigned long addr, pte_t *ptep);
961
962 #define __HAVE_ARCH_PTEP_CLEAR_YOUNG_FLUSH
963 extern int ptep_clear_flush_young(struct vm_area_struct *vma,
964                                   unsigned long address, pte_t *ptep);
965
966 #define __HAVE_ARCH_PTEP_GET_AND_CLEAR
967 static inline pte_t ptep_get_and_clear(struct mm_struct *mm, unsigned long addr,
968                                        pte_t *ptep)
969 {
970         pte_t pte = native_ptep_get_and_clear(ptep);
971         pte_update(mm, addr, ptep);
972         return pte;
973 }
974
975 #define __HAVE_ARCH_PTEP_GET_AND_CLEAR_FULL
976 static inline pte_t ptep_get_and_clear_full(struct mm_struct *mm,
977                                             unsigned long addr, pte_t *ptep,
978                                             int full)
979 {
980         pte_t pte;
981         if (full) {
982                 /*
983                  * Full address destruction in progress; paravirt does not
984                  * care about updates and native needs no locking
985                  */
986                 pte = native_local_ptep_get_and_clear(ptep);
987         } else {
988                 pte = ptep_get_and_clear(mm, addr, ptep);
989         }
990         return pte;
991 }
992
993 #define __HAVE_ARCH_PTEP_SET_WRPROTECT
994 static inline void ptep_set_wrprotect(struct mm_struct *mm,
995                                       unsigned long addr, pte_t *ptep)
996 {
997         clear_bit(_PAGE_BIT_RW, (unsigned long *)&ptep->pte);
998         pte_update(mm, addr, ptep);
999 }
1000
1001 #define flush_tlb_fix_spurious_fault(vma, address) do { } while (0)
1002
1003 #define mk_pmd(page, pgprot)   pfn_pmd(page_to_pfn(page), (pgprot))
1004
1005 #define  __HAVE_ARCH_PMDP_SET_ACCESS_FLAGS
1006 extern int pmdp_set_access_flags(struct vm_area_struct *vma,
1007                                  unsigned long address, pmd_t *pmdp,
1008                                  pmd_t entry, int dirty);
1009 extern int pudp_set_access_flags(struct vm_area_struct *vma,
1010                                  unsigned long address, pud_t *pudp,
1011                                  pud_t entry, int dirty);
1012
1013 #define __HAVE_ARCH_PMDP_TEST_AND_CLEAR_YOUNG
1014 extern int pmdp_test_and_clear_young(struct vm_area_struct *vma,
1015                                      unsigned long addr, pmd_t *pmdp);
1016 extern int pudp_test_and_clear_young(struct vm_area_struct *vma,
1017                                      unsigned long addr, pud_t *pudp);
1018
1019 #define __HAVE_ARCH_PMDP_CLEAR_YOUNG_FLUSH
1020 extern int pmdp_clear_flush_young(struct vm_area_struct *vma,
1021                                   unsigned long address, pmd_t *pmdp);
1022
1023
1024 #define __HAVE_ARCH_PMD_WRITE
1025 static inline int pmd_write(pmd_t pmd)
1026 {
1027         return pmd_flags(pmd) & _PAGE_RW;
1028 }
1029
1030 #define __HAVE_ARCH_PMDP_HUGE_GET_AND_CLEAR
1031 static inline pmd_t pmdp_huge_get_and_clear(struct mm_struct *mm, unsigned long addr,
1032                                        pmd_t *pmdp)
1033 {
1034         return native_pmdp_get_and_clear(pmdp);
1035 }
1036
1037 #define __HAVE_ARCH_PUDP_HUGE_GET_AND_CLEAR
1038 static inline pud_t pudp_huge_get_and_clear(struct mm_struct *mm,
1039                                         unsigned long addr, pud_t *pudp)
1040 {
1041         return native_pudp_get_and_clear(pudp);
1042 }
1043
1044 #define __HAVE_ARCH_PMDP_SET_WRPROTECT
1045 static inline void pmdp_set_wrprotect(struct mm_struct *mm,
1046                                       unsigned long addr, pmd_t *pmdp)
1047 {
1048         clear_bit(_PAGE_BIT_RW, (unsigned long *)pmdp);
1049 }
1050
1051 /*
1052  * clone_pgd_range(pgd_t *dst, pgd_t *src, int count);
1053  *
1054  *  dst - pointer to pgd range anwhere on a pgd page
1055  *  src - ""
1056  *  count - the number of pgds to copy.
1057  *
1058  * dst and src can be on the same page, but the range must not overlap,
1059  * and must not cross a page boundary.
1060  */
1061 static inline void clone_pgd_range(pgd_t *dst, pgd_t *src, int count)
1062 {
1063        memcpy(dst, src, count * sizeof(pgd_t));
1064 }
1065
1066 #define PTE_SHIFT ilog2(PTRS_PER_PTE)
1067 static inline int page_level_shift(enum pg_level level)
1068 {
1069         return (PAGE_SHIFT - PTE_SHIFT) + level * PTE_SHIFT;
1070 }
1071 static inline unsigned long page_level_size(enum pg_level level)
1072 {
1073         return 1UL << page_level_shift(level);
1074 }
1075 static inline unsigned long page_level_mask(enum pg_level level)
1076 {
1077         return ~(page_level_size(level) - 1);
1078 }
1079
1080 /*
1081  * The x86 doesn't have any external MMU info: the kernel page
1082  * tables contain all the necessary information.
1083  */
1084 static inline void update_mmu_cache(struct vm_area_struct *vma,
1085                 unsigned long addr, pte_t *ptep)
1086 {
1087 }
1088 static inline void update_mmu_cache_pmd(struct vm_area_struct *vma,
1089                 unsigned long addr, pmd_t *pmd)
1090 {
1091 }
1092 static inline void update_mmu_cache_pud(struct vm_area_struct *vma,
1093                 unsigned long addr, pud_t *pud)
1094 {
1095 }
1096
1097 #ifdef CONFIG_HAVE_ARCH_SOFT_DIRTY
1098 static inline pte_t pte_swp_mksoft_dirty(pte_t pte)
1099 {
1100         return pte_set_flags(pte, _PAGE_SWP_SOFT_DIRTY);
1101 }
1102
1103 static inline int pte_swp_soft_dirty(pte_t pte)
1104 {
1105         return pte_flags(pte) & _PAGE_SWP_SOFT_DIRTY;
1106 }
1107
1108 static inline pte_t pte_swp_clear_soft_dirty(pte_t pte)
1109 {
1110         return pte_clear_flags(pte, _PAGE_SWP_SOFT_DIRTY);
1111 }
1112 #endif
1113
1114 #define PKRU_AD_BIT 0x1
1115 #define PKRU_WD_BIT 0x2
1116 #define PKRU_BITS_PER_PKEY 2
1117
1118 static inline bool __pkru_allows_read(u32 pkru, u16 pkey)
1119 {
1120         int pkru_pkey_bits = pkey * PKRU_BITS_PER_PKEY;
1121         return !(pkru & (PKRU_AD_BIT << pkru_pkey_bits));
1122 }
1123
1124 static inline bool __pkru_allows_write(u32 pkru, u16 pkey)
1125 {
1126         int pkru_pkey_bits = pkey * PKRU_BITS_PER_PKEY;
1127         /*
1128          * Access-disable disables writes too so we need to check
1129          * both bits here.
1130          */
1131         return !(pkru & ((PKRU_AD_BIT|PKRU_WD_BIT) << pkru_pkey_bits));
1132 }
1133
1134 static inline u16 pte_flags_pkey(unsigned long pte_flags)
1135 {
1136 #ifdef CONFIG_X86_INTEL_MEMORY_PROTECTION_KEYS
1137         /* ifdef to avoid doing 59-bit shift on 32-bit values */
1138         return (pte_flags & _PAGE_PKEY_MASK) >> _PAGE_BIT_PKEY_BIT0;
1139 #else
1140         return 0;
1141 #endif
1142 }
1143
1144 static inline bool __pkru_allows_pkey(u16 pkey, bool write)
1145 {
1146         u32 pkru = read_pkru();
1147
1148         if (!__pkru_allows_read(pkru, pkey))
1149                 return false;
1150         if (write && !__pkru_allows_write(pkru, pkey))
1151                 return false;
1152
1153         return true;
1154 }
1155
1156 /*
1157  * 'pteval' can come from a PTE, PMD or PUD.  We only check
1158  * _PAGE_PRESENT, _PAGE_USER, and _PAGE_RW in here which are the
1159  * same value on all 3 types.
1160  */
1161 static inline bool __pte_access_permitted(unsigned long pteval, bool write)
1162 {
1163         unsigned long need_pte_bits = _PAGE_PRESENT|_PAGE_USER;
1164
1165         if (write)
1166                 need_pte_bits |= _PAGE_RW;
1167
1168         if ((pteval & need_pte_bits) != need_pte_bits)
1169                 return 0;
1170
1171         return __pkru_allows_pkey(pte_flags_pkey(pteval), write);
1172 }
1173
1174 #define pte_access_permitted pte_access_permitted
1175 static inline bool pte_access_permitted(pte_t pte, bool write)
1176 {
1177         return __pte_access_permitted(pte_val(pte), write);
1178 }
1179
1180 #define pmd_access_permitted pmd_access_permitted
1181 static inline bool pmd_access_permitted(pmd_t pmd, bool write)
1182 {
1183         return __pte_access_permitted(pmd_val(pmd), write);
1184 }
1185
1186 #define pud_access_permitted pud_access_permitted
1187 static inline bool pud_access_permitted(pud_t pud, bool write)
1188 {
1189         return __pte_access_permitted(pud_val(pud), write);
1190 }
1191
1192 #include <asm-generic/pgtable.h>
1193 #endif  /* __ASSEMBLY__ */
1194
1195 #endif /* _ASM_X86_PGTABLE_H */