]> git.kernelconcepts.de Git - karo-tx-linux.git/blob - virt/kvm/iommu.c
kvm: Create non-coherent DMA registeration
[karo-tx-linux.git] / virt / kvm / iommu.c
1 /*
2  * Copyright (c) 2006, Intel Corporation.
3  *
4  * This program is free software; you can redistribute it and/or modify it
5  * under the terms and conditions of the GNU General Public License,
6  * version 2, as published by the Free Software Foundation.
7  *
8  * This program is distributed in the hope it will be useful, but WITHOUT
9  * ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or
10  * FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License for
11  * more details.
12  *
13  * You should have received a copy of the GNU General Public License along with
14  * this program; if not, write to the Free Software Foundation, Inc., 59 Temple
15  * Place - Suite 330, Boston, MA 02111-1307 USA.
16  *
17  * Copyright (C) 2006-2008 Intel Corporation
18  * Copyright IBM Corporation, 2008
19  * Copyright 2010 Red Hat, Inc. and/or its affiliates.
20  *
21  * Author: Allen M. Kay <allen.m.kay@intel.com>
22  * Author: Weidong Han <weidong.han@intel.com>
23  * Author: Ben-Ami Yassour <benami@il.ibm.com>
24  */
25
26 #include <linux/list.h>
27 #include <linux/kvm_host.h>
28 #include <linux/module.h>
29 #include <linux/pci.h>
30 #include <linux/stat.h>
31 #include <linux/dmar.h>
32 #include <linux/iommu.h>
33 #include <linux/intel-iommu.h>
34
35 static bool allow_unsafe_assigned_interrupts;
36 module_param_named(allow_unsafe_assigned_interrupts,
37                    allow_unsafe_assigned_interrupts, bool, S_IRUGO | S_IWUSR);
38 MODULE_PARM_DESC(allow_unsafe_assigned_interrupts,
39  "Enable device assignment on platforms without interrupt remapping support.");
40
41 static int kvm_iommu_unmap_memslots(struct kvm *kvm);
42 static void kvm_iommu_put_pages(struct kvm *kvm,
43                                 gfn_t base_gfn, unsigned long npages);
44
45 static pfn_t kvm_pin_pages(struct kvm_memory_slot *slot, gfn_t gfn,
46                            unsigned long size)
47 {
48         gfn_t end_gfn;
49         pfn_t pfn;
50
51         pfn     = gfn_to_pfn_memslot(slot, gfn);
52         end_gfn = gfn + (size >> PAGE_SHIFT);
53         gfn    += 1;
54
55         if (is_error_noslot_pfn(pfn))
56                 return pfn;
57
58         while (gfn < end_gfn)
59                 gfn_to_pfn_memslot(slot, gfn++);
60
61         return pfn;
62 }
63
64 int kvm_iommu_map_pages(struct kvm *kvm, struct kvm_memory_slot *slot)
65 {
66         gfn_t gfn, end_gfn;
67         pfn_t pfn;
68         int r = 0;
69         struct iommu_domain *domain = kvm->arch.iommu_domain;
70         int flags;
71
72         /* check if iommu exists and in use */
73         if (!domain)
74                 return 0;
75
76         gfn     = slot->base_gfn;
77         end_gfn = gfn + slot->npages;
78
79         flags = IOMMU_READ;
80         if (!(slot->flags & KVM_MEM_READONLY))
81                 flags |= IOMMU_WRITE;
82         if (!kvm->arch.iommu_noncoherent)
83                 flags |= IOMMU_CACHE;
84
85
86         while (gfn < end_gfn) {
87                 unsigned long page_size;
88
89                 /* Check if already mapped */
90                 if (iommu_iova_to_phys(domain, gfn_to_gpa(gfn))) {
91                         gfn += 1;
92                         continue;
93                 }
94
95                 /* Get the page size we could use to map */
96                 page_size = kvm_host_page_size(kvm, gfn);
97
98                 /* Make sure the page_size does not exceed the memslot */
99                 while ((gfn + (page_size >> PAGE_SHIFT)) > end_gfn)
100                         page_size >>= 1;
101
102                 /* Make sure gfn is aligned to the page size we want to map */
103                 while ((gfn << PAGE_SHIFT) & (page_size - 1))
104                         page_size >>= 1;
105
106                 /*
107                  * Pin all pages we are about to map in memory. This is
108                  * important because we unmap and unpin in 4kb steps later.
109                  */
110                 pfn = kvm_pin_pages(slot, gfn, page_size);
111                 if (is_error_noslot_pfn(pfn)) {
112                         gfn += 1;
113                         continue;
114                 }
115
116                 /* Map into IO address space */
117                 r = iommu_map(domain, gfn_to_gpa(gfn), pfn_to_hpa(pfn),
118                               page_size, flags);
119                 if (r) {
120                         printk(KERN_ERR "kvm_iommu_map_address:"
121                                "iommu failed to map pfn=%llx\n", pfn);
122                         goto unmap_pages;
123                 }
124
125                 gfn += page_size >> PAGE_SHIFT;
126
127
128         }
129
130         return 0;
131
132 unmap_pages:
133         kvm_iommu_put_pages(kvm, slot->base_gfn, gfn);
134         return r;
135 }
136
137 static int kvm_iommu_map_memslots(struct kvm *kvm)
138 {
139         int idx, r = 0;
140         struct kvm_memslots *slots;
141         struct kvm_memory_slot *memslot;
142
143         if (kvm->arch.iommu_noncoherent)
144                 kvm_arch_register_noncoherent_dma(kvm);
145
146         idx = srcu_read_lock(&kvm->srcu);
147         slots = kvm_memslots(kvm);
148
149         kvm_for_each_memslot(memslot, slots) {
150                 r = kvm_iommu_map_pages(kvm, memslot);
151                 if (r)
152                         break;
153         }
154         srcu_read_unlock(&kvm->srcu, idx);
155
156         return r;
157 }
158
159 int kvm_assign_device(struct kvm *kvm,
160                       struct kvm_assigned_dev_kernel *assigned_dev)
161 {
162         struct pci_dev *pdev = NULL;
163         struct iommu_domain *domain = kvm->arch.iommu_domain;
164         int r;
165         bool noncoherent;
166
167         /* check if iommu exists and in use */
168         if (!domain)
169                 return 0;
170
171         pdev = assigned_dev->dev;
172         if (pdev == NULL)
173                 return -ENODEV;
174
175         r = iommu_attach_device(domain, &pdev->dev);
176         if (r) {
177                 dev_err(&pdev->dev, "kvm assign device failed ret %d", r);
178                 return r;
179         }
180
181         noncoherent = !iommu_domain_has_cap(kvm->arch.iommu_domain,
182                                             IOMMU_CAP_CACHE_COHERENCY);
183
184         /* Check if need to update IOMMU page table for guest memory */
185         if (noncoherent != kvm->arch.iommu_noncoherent) {
186                 kvm_iommu_unmap_memslots(kvm);
187                 kvm->arch.iommu_noncoherent = noncoherent;
188                 r = kvm_iommu_map_memslots(kvm);
189                 if (r)
190                         goto out_unmap;
191         }
192
193         pdev->dev_flags |= PCI_DEV_FLAGS_ASSIGNED;
194
195         dev_info(&pdev->dev, "kvm assign device\n");
196
197         return 0;
198 out_unmap:
199         kvm_iommu_unmap_memslots(kvm);
200         return r;
201 }
202
203 int kvm_deassign_device(struct kvm *kvm,
204                         struct kvm_assigned_dev_kernel *assigned_dev)
205 {
206         struct iommu_domain *domain = kvm->arch.iommu_domain;
207         struct pci_dev *pdev = NULL;
208
209         /* check if iommu exists and in use */
210         if (!domain)
211                 return 0;
212
213         pdev = assigned_dev->dev;
214         if (pdev == NULL)
215                 return -ENODEV;
216
217         iommu_detach_device(domain, &pdev->dev);
218
219         pdev->dev_flags &= ~PCI_DEV_FLAGS_ASSIGNED;
220
221         dev_info(&pdev->dev, "kvm deassign device\n");
222
223         return 0;
224 }
225
226 int kvm_iommu_map_guest(struct kvm *kvm)
227 {
228         int r;
229
230         if (!iommu_present(&pci_bus_type)) {
231                 printk(KERN_ERR "%s: iommu not found\n", __func__);
232                 return -ENODEV;
233         }
234
235         mutex_lock(&kvm->slots_lock);
236
237         kvm->arch.iommu_domain = iommu_domain_alloc(&pci_bus_type);
238         if (!kvm->arch.iommu_domain) {
239                 r = -ENOMEM;
240                 goto out_unlock;
241         }
242
243         if (!allow_unsafe_assigned_interrupts &&
244             !iommu_domain_has_cap(kvm->arch.iommu_domain,
245                                   IOMMU_CAP_INTR_REMAP)) {
246                 printk(KERN_WARNING "%s: No interrupt remapping support,"
247                        " disallowing device assignment."
248                        " Re-enble with \"allow_unsafe_assigned_interrupts=1\""
249                        " module option.\n", __func__);
250                 iommu_domain_free(kvm->arch.iommu_domain);
251                 kvm->arch.iommu_domain = NULL;
252                 r = -EPERM;
253                 goto out_unlock;
254         }
255
256         r = kvm_iommu_map_memslots(kvm);
257         if (r)
258                 kvm_iommu_unmap_memslots(kvm);
259
260 out_unlock:
261         mutex_unlock(&kvm->slots_lock);
262         return r;
263 }
264
265 static void kvm_unpin_pages(struct kvm *kvm, pfn_t pfn, unsigned long npages)
266 {
267         unsigned long i;
268
269         for (i = 0; i < npages; ++i)
270                 kvm_release_pfn_clean(pfn + i);
271 }
272
273 static void kvm_iommu_put_pages(struct kvm *kvm,
274                                 gfn_t base_gfn, unsigned long npages)
275 {
276         struct iommu_domain *domain;
277         gfn_t end_gfn, gfn;
278         pfn_t pfn;
279         u64 phys;
280
281         domain  = kvm->arch.iommu_domain;
282         end_gfn = base_gfn + npages;
283         gfn     = base_gfn;
284
285         /* check if iommu exists and in use */
286         if (!domain)
287                 return;
288
289         while (gfn < end_gfn) {
290                 unsigned long unmap_pages;
291                 size_t size;
292
293                 /* Get physical address */
294                 phys = iommu_iova_to_phys(domain, gfn_to_gpa(gfn));
295
296                 if (!phys) {
297                         gfn++;
298                         continue;
299                 }
300
301                 pfn  = phys >> PAGE_SHIFT;
302
303                 /* Unmap address from IO address space */
304                 size       = iommu_unmap(domain, gfn_to_gpa(gfn), PAGE_SIZE);
305                 unmap_pages = 1ULL << get_order(size);
306
307                 /* Unpin all pages we just unmapped to not leak any memory */
308                 kvm_unpin_pages(kvm, pfn, unmap_pages);
309
310                 gfn += unmap_pages;
311         }
312 }
313
314 void kvm_iommu_unmap_pages(struct kvm *kvm, struct kvm_memory_slot *slot)
315 {
316         kvm_iommu_put_pages(kvm, slot->base_gfn, slot->npages);
317 }
318
319 static int kvm_iommu_unmap_memslots(struct kvm *kvm)
320 {
321         int idx;
322         struct kvm_memslots *slots;
323         struct kvm_memory_slot *memslot;
324
325         idx = srcu_read_lock(&kvm->srcu);
326         slots = kvm_memslots(kvm);
327
328         kvm_for_each_memslot(memslot, slots)
329                 kvm_iommu_unmap_pages(kvm, memslot);
330
331         srcu_read_unlock(&kvm->srcu, idx);
332
333         if (kvm->arch.iommu_noncoherent)
334                 kvm_arch_unregister_noncoherent_dma(kvm);
335
336         return 0;
337 }
338
339 int kvm_iommu_unmap_guest(struct kvm *kvm)
340 {
341         struct iommu_domain *domain = kvm->arch.iommu_domain;
342
343         /* check if iommu exists and in use */
344         if (!domain)
345                 return 0;
346
347         mutex_lock(&kvm->slots_lock);
348         kvm_iommu_unmap_memslots(kvm);
349         kvm->arch.iommu_domain = NULL;
350         kvm->arch.iommu_noncoherent = false;
351         mutex_unlock(&kvm->slots_lock);
352
353         iommu_domain_free(domain);
354         return 0;
355 }